Glosario
Términos clave de IA aplicada en B2B.
Definiciones operativas, no académicas. Lo que un fundador o director de operaciones necesita saber para negociar un proveedor de IA sin que le marquen.
- Agente de IA
- Sistema que toma decisiones y ejecuta acciones de forma autónoma usando un modelo de lenguaje como motor de razonamiento.
- A diferencia de un chatbot, un agente puede invocar herramientas (APIs, bases de datos, funciones) para completar tareas reales. Un buen agente B2B no solo responde: actualiza el CRM, agenda la llamada, manda el presupuesto. La diferencia entre un agente útil y uno frustrante está en cómo se diseñan sus límites y su escalada a humano.
- RAG (Retrieval-Augmented Generation)
- Técnica que combina un buscador sobre tu documentación con un modelo de lenguaje que redacta la respuesta con esos fragmentos delante.
- No es un fin en sí mismo. Es la manera de que un modelo conteste con información que no estaba en su entrenamiento, citando fuentes y manteniendo la respuesta acotada al material de la empresa. Cuando RAG funciona en producción no es porque alguien encontró el modelo perfecto, es porque alguien curó las fuentes y monitorizó las respuestas durante semanas.
- Base de datos vectorial
- Buscador por significado, no por palabras: encuentra contenido parecido en sentido aunque no comparta vocabulario.
- Si guardas "el cliente quiere cancelar el contrato" y buscas "baja del servicio", el sistema te lo devuelve. Cambia lo que puedes hacer con tu documentación: por primera vez puedes preguntar a un repositorio en lenguaje natural sin que importe si usaste exactamente las mismas palabras que el redactor original. La elección del proveedor importa menos que cómo segmentes el contenido.
- Embeddings
- Representación numérica de texto, imagen o cualquier dato en forma de vector que captura su significado.
- Es la pieza que hace funcionar la búsqueda semántica: dos textos con embeddings parecidos están relacionados. La calidad del modelo de embeddings (no solo del LLM) determina la calidad de tu sistema de búsqueda. Cambiar de modelo de embeddings implica reindexar todo, así que la decisión inicial pesa.
- Fine-tuning
- Reentrenar parcialmente un modelo preexistente sobre tus datos para que adopte tu tono, estilo o conocimiento específico.
- Es caro, lento y normalmente innecesario en B2B mid-market. Para el 90% de los casos, un buen prompt + RAG da mejor resultado a un décimo del coste. El fine-tuning solo paga la pena cuando necesitas que el modelo siga un formato muy estricto que el prompt no puede forzar.
- Prompt engineering
- Diseñar las instrucciones que recibe un modelo para que produzca el output esperado de forma consistente.
- Más arte que ciencia, pero hay patrones que funcionan: dar ejemplos, descomponer el problema, separar contexto de instrucciones, controlar el formato de salida. Un buen prompt en producción tiene más en común con un manual de operaciones que con un spell mágico.
- Tool calling (function calling)
- Capacidad de un modelo de lenguaje para invocar funciones externas (APIs, bases de datos) y usar el resultado en su respuesta.
- Es lo que separa un chatbot de un agente real. El modelo decide cuándo llamar a una herramienta, qué parámetros pasarle y qué hacer con la respuesta. La complejidad real está en la orquestación: cuando hay 5+ herramientas, el modelo se confunde, y el sistema necesita un router por encima.
- Context window
- Cantidad máxima de tokens (texto) que un modelo puede procesar en una sola llamada.
- En 2026 los modelos top tienen 200k-1M tokens de ventana, pero meterle todo lo que tienes a un modelo no es siempre la mejor estrategia. Más contexto = más coste, más latencia, y a partir de cierto tamaño el modelo empieza a "perder" información del medio. RAG sigue siendo más barato y más fiable para repositorios grandes.
- Alucinación
- Cuando un modelo genera información plausible pero falsa, presentándola con la misma confianza que la información correcta.
- En B2B, una alucinación cuesta dinero y reputación. Las técnicas para reducirla: RAG con citas obligatorias, output estructurado con esquemas, validadores externos, escalada a humano cuando la confianza es baja. Asumir que "el modelo nuevo no alucina" es un error caro: todos alucinan, varía la frecuencia y el tipo.
- Salida estructurada (Structured output)
- Forzar al modelo a devolver JSON válido con un esquema concreto, en vez de texto libre.
- Es la diferencia entre un sistema demo y un sistema productivo. Si tu pipeline depende de que el modelo devuelva siempre `{ "score": 0.8, "reason": "..." }`, no puedes permitir variabilidad. Los modelos top ya soportan structured outputs nativos; usar prompts "devuelve JSON por favor" es jugar a la ruleta.
- Patrón agentic
- Arquitectura donde múltiples llamadas al modelo se encadenan dinámicamente, decidiendo cada paso en función del anterior.
- Más potente que una llamada única, pero exponencialmente más frágil. Cada paso multiplica la probabilidad de fallo. Los patrones agentic que funcionan en producción suelen ser los más simples: planear, ejecutar, verificar, escalar a humano si algo no encaja. La obsesión con sistemas multi-agente complejos rara vez sobrevive al primer mes.
- Churn predictor
- Sistema que estima en tiempo real la probabilidad de que un cliente cancele el servicio, para que el equipo pueda intervenir.
- Combina señales de uso (frecuencia, profundidad), señales conversacionales (sentimiento de los mensajes), y eventos de negocio (impagos, downgrades). El valor no está en la predicción sino en la acción que dispara: si el equipo de customer success no actúa sobre la señal, el predictor no sirve.
- Lead qualification automática
- Proceso por el cual un agente o sistema cualifica leads entrantes (presupuesto, encaje, urgencia) antes de pasarlos al equipo comercial.
- En B2B mid-market, el equipo comercial gasta 60-70% del tiempo con leads que no encajan. Un cualificador IA bien diseñado pregunta lo justo (3-5 preguntas), no lo expulsa, y solo agenda reunión cuando hay encaje real. La métrica clave: % de reuniones que terminan en propuesta, no número de reuniones.
- Automatización de workflow
- Conectar dos o más sistemas (CRM, ERP, email, Slack) para que un evento dispare acciones automáticas sin intervención humana.
- Es el primo más maduro de la IA: lleva décadas funcionando con tools como Zapier, Make o n8n. La pregunta no es si automatizar, es qué automatizar. La regla práctica: si una persona del equipo lo hace más de 5 veces a la semana siguiendo siempre los mismos pasos, candidato.
- Integración API
- Conexión técnica entre dos sistemas usando interfaces estándar (REST, webhooks, eventos) para intercambiar datos en tiempo real.
- Es la fontanería invisible que hace que un agente IA sirva. Cuando el agente "actualiza el CRM", lo que hace es una llamada API a HubSpot o Salesforce. La calidad de la integración determina si el sistema escala o se rompe a las 3 semanas.
- Observabilidad de IA
- Monitorización de un sistema de IA en producción: latencia, coste, calidad de respuesta, tasa de escalada, drift.
- Sin observabilidad, no sabes si tu agente está degradándose. Los modelos cambian (los proveedores actualizan), tus datos cambian (tu producto evoluciona), y los usuarios cambian (entienden más al sistema y prueban más). Tools como Langfuse, Arize, Helicone hacen esto fácil. Sin ellas, vas a ciegas.
- Guardrails
- Reglas o validadores que limitan lo que un agente IA puede hacer o decir, especialmente fuera de su dominio.
- Sin guardrails, un agente bien intencionado puede prometer lo que no puede cumplir, dar consejo legal, o filtrar información de un cliente a otro. Los guardrails efectivos son combinación de prompt + validador externo + escalada humana. Asumir que "el modelo se va a portar bien" es una decisión de producto, no técnica.
- Time-to-production
- Tiempo desde el primer commit hasta que un sistema de IA atiende tráfico real con clientes reales.
- En consultoría IA mid-market, 2-4 semanas es realista para un primer agente útil. POCs de 6 meses casi siempre fracasan: pierden el tema de negocio inicial. La regla: si después de un mes no hay tráfico real, el proyecto está muerto y nadie lo dirá hasta el quinto.
- ROI de IA
- Cálculo del retorno de un proyecto de IA: horas ahorradas + ingreso adicional + retención de clientes vs coste total.
- En B2B, el ROI más fácil de defender es horas ahorradas × coste/hora del equipo, comparado con el coste de modelo + infra + mantenimiento. El ROI más difícil pero más alto: ingreso incremental por velocidad de respuesta, calificación mejorada, churn reducido. Si no puedes medirlo, no estás haciendo IA productiva, estás haciendo IA decorativa.
- Fractional CTO / arquitecto de sistemas
- Persona externa que asume la dirección técnica o arquitectónica de una empresa a tiempo parcial, sin estar en plantilla.
- Encaja para empresas €1-10M de facturación que tienen complejidad técnica creciente pero no justifican un CTO senior full-time (€150k+). Un fractional aporta criterio sin coste fijo: revisa decisiones, marca dirección, valida proveedores. En IA específicamente, evita los errores caros de elegir el stack equivocado en mes 2.
Relacionado:que es rag y cuando tiene sentido
Relacionado:bases de datos vectoriales explicadas
Relacionado:mitos de la ingenieria de prompts
Relacionado:tool calling y orquestacion
Relacionado:salidas estructuradas vs texto libre
Relacionado:patrones agentes funcionan
Relacionado:kpis agente ia produccion
Relacionado:por que mueren poc ia
