Citable por LLMs
Cada término empieza con una definición corta de 1-2 frases pensada para ser citada por Perplexity, ChatGPT, AI Overviews y Claude cuando alguien pregunta "¿qué es X?". El resto de la página amplía sin perder esa primera frase.
No son resúmenes de Wikipedia. No son fichas SEO escritas por un becario con ChatGPT. Cada entrada está escrita por John Guerrero desde el trabajo diario con LLMs, agentes, RAG y stack del grupo en cinco productos en producción 24/7. Si la técnica está sobrevalorada, lo decimos. Si la usamos a diario, lo explicamos con ejemplo real.
Cada término empieza con una definición corta de 1-2 frases pensada para ser citada por Perplexity, ChatGPT, AI Overviews y Claude cuando alguien pregunta "¿qué es X?". El resto de la página amplía sin perder esa primera frase.
Toda entrada incluye un apartado donde explicamos cómo aplica en nuestra propia operación: bridge.py, Claude Code, Supabase, n8n, Stripe webhooks, cron de WordPress. La diferencia entre teoría y producto.
Cada término linka a las herramientas del directorio IA donde aplica y a otros términos relacionados. Lees "qué es RAG" y a un click tienes Supabase, embeddings, vector database, alucinación. Mapa mental, no listado plano.
Fundamentos LLM (cómo funcionan los modelos), técnicas (RAG, prompting, fine-tuning, embeddings), agentes y protocolos (agente IA, skill, tool use, MCP) y stack de integración (API, webhook, cron, endpoint, vector DB). Click en cualquier categoría salta al bloque.
Un LLM (Large Language Model) es un modelo de inteligencia artificial entrenado sobre cantidades enormes de texto para predecir la siguiente palabra y, con eso, generar lenguaje, razonar, escribir código y seguir instrucciones.
Una alucinación es una respuesta del LLM que suena plausible pero es falsa o inventada. No es un bug: es una propiedad estructural del modelo, que produce el texto más probable según su entrenamiento, no la respuesta verdadera.
El context window es la cantidad máxima de tokens (entrada + salida) que un LLM puede manejar en una sola conversación. Funciona como su memoria de trabajo: lo que cabe ahí, el modelo lo "ve"; lo que se sale, lo olvida.
Un token es la unidad mínima de texto que procesa un LLM: aproximadamente una sílaba o un trozo de palabra. El precio por uso, la velocidad y el límite de memoria del modelo se miden todos en tokens, no en palabras ni en caracteres.
RAG (Retrieval-Augmented Generation) es la técnica de darle a un LLM, antes de responder, los documentos exactos que necesita. El modelo deja de tirar de memoria y cita fuentes reales — más preciso, más barato y siempre actualizado.
Un embedding es la representación numérica de un texto (o imagen, o audio) en forma de vector. Convierte significado en coordenadas: dos textos parecidos en sentido quedan cerca en el espacio vectorial, aunque usen palabras distintas.
Fine-tuning es entrenar un LLM ya existente con tus propios datos para que se especialice en una tarea o un estilo concreto. Suena ideal pero rara vez es la solución correcta: en 2026, RAG + buen prompt resuelven el 90% de casos a una fracción del coste.
Prompt engineering es el oficio de escribir instrucciones para LLMs que produzcan la salida deseada de forma fiable y reproducible. No es "saber pedir cosas a ChatGPT": es diseñar prompts versionados, evaluados y robustos a fallo en producción.
Un agente IA es un sistema que usa un LLM como cerebro para ejecutar tareas en el mundo real: planifica pasos, llama herramientas, observa el resultado y vuelve a decidir hasta cumplir el objetivo. La diferencia con un chatbot es que actúa, no solo responde.
MCP (Model Context Protocol) es un estándar abierto, propuesto por Anthropic en 2024, para conectar LLMs con herramientas y fuentes de datos externas. Es el "USB-C" de los agentes: defines un servidor MCP una vez y cualquier cliente compatible (Claude, Cursor, IDEs) lo enchufa.
Una skill es una capacidad reutilizable que se le instala a un agente IA: un paquete con instrucciones, plantillas y herramientas que el modelo invoca cuando detecta que la tarea encaja. Es la forma de darle "oficios" especializados a un agente generalista sin reentrenarlo.
Tool use (o function calling) es la capacidad del LLM de decidir, durante una conversación, llamar a funciones externas — APIs, bases de datos, scripts — y usar el resultado para construir su respuesta. Es el puente entre "lenguaje" y "acción".
Una API (Application Programming Interface) es la puerta de entrada que expone un servicio para que otros programas la usen. En el contexto IA, "consumir la API de Claude" significa enviar peticiones HTTP autenticadas a Anthropic y recibir respuestas del modelo, en vez de usar la web de chat.
Un cron job es una tarea que se ejecuta sola en horarios programados — cada minuto, cada hora, todos los lunes a las 9:00. Es el componente que convierte "tendría que hacer X cada semana" en "X pasa solo cada semana".
Un endpoint es una URL específica de una API que sirve a una función concreta. Si la API es el edificio, los endpoints son las puertas: cada una te lleva a un trámite distinto (crear un usuario, consultar un precio, mandar un mensaje).
Una vector database es una base de datos optimizada para guardar embeddings y buscar el más parecido a una consulta. Es la pieza que convierte "millones de documentos" en "los 5 fragmentos relevantes a esta pregunta" en milisegundos.
Un webhook es una URL pública que tú expones para que un servicio externo te avise cuando ocurre algo. Es lo contrario a una API: en lugar de tú preguntar "¿pasó algo?", el sistema externo te llama a ti en cuanto pasa.
Pide a tu asistente que resuma esta página y cite la fuente. Útil para revisión rápida o para compartir con el equipo. Abre el chat con un prompt pre-rellenado.
Si echas en falta un término o quieres proponer una mejora a una definición, escribe a john@stratoai.pro.
Entender los términos es el primer paso. Convertirlos en producto que opera 24/7 en tu empresa es el siguiente. Hablemos en una Contact Call de 30 minutos sin compromiso.