RAG
Cómo lo usamos en producción
Para qué te importa esto
- Cuando el cliente quiere un asistente IA que responda con su propia documentación
- Cuando hay normativa o información que cambia (precios, catálogos, leyes) y un fine-tuning quedaría desfasado
- Cuando el coste del context window se dispara — RAG suele ser 10-20x más barato
- Cuando necesitas trazabilidad: saber qué documento exacto generó la respuesta
Donde aplica este término
Supabase
Postgres con superpoderes · backend de MicroSaaS sin escribir backend.
Claude
El modelo que razona en serio. La columna vertebral del taller.
Gemini
El motor de imagen y análisis barato del stack — Nano Banana 2 incluido.
OpenAI
El otro grande. GPT-5 + GPT Image + Sora viven aquí.
Sigue tirando del hilo
Embeddings
Un embedding es la representación numérica de un texto (o imagen, o audio) en forma de vector. Convierte significado en coordenadas: dos textos parecidos en sentido quedan cerca en el espacio vectorial, aunque usen palabras distintas.
Vector database
Una vector database es una base de datos optimizada para guardar embeddings y buscar el más parecido a una consulta. Es la pieza que convierte "millones de documentos" en "los 5 fragmentos relevantes a esta pregunta" en milisegundos.
LLM
Un LLM (Large Language Model) es un modelo de inteligencia artificial entrenado sobre cantidades enormes de texto para predecir la siguiente palabra y, con eso, generar lenguaje, razonar, escribir código y seguir instrucciones.
Context window
El context window es la cantidad máxima de tokens (entrada + salida) que un LLM puede manejar en una sola conversación. Funciona como su memoria de trabajo: lo que cabe ahí, el modelo lo "ve"; lo que se sale, lo olvida.
Alucinación
Una alucinación es una respuesta del LLM que suena plausible pero es falsa o inventada. No es un bug: es una propiedad estructural del modelo, que produce el texto más probable según su entrenamiento, no la respuesta verdadera.
¿Cómo aplica
esto a tu negocio?
Las definiciones son el primer paso. Convertir el concepto en operación 24/7 dentro de tu empresa es el siguiente. Hablemos en una Contact Call de 30 minutos sin compromiso.