◆ Fundamentos LLM

LLM

También conocido como: Large Language Model · Modelo de lenguaje grande · Modelo de lenguaje

Un LLM (Large Language Model) es un modelo de inteligencia artificial entrenado sobre cantidades enormes de texto para predecir la siguiente palabra y, con eso, generar lenguaje, razonar, escribir código y seguir instrucciones.

← Todos los términos Aplicar a mi caso →

// Definición extendida

Un LLM es la pieza central de la mayoría de productos IA modernos. Aprende patrones del lenguaje a escala — sintaxis, conceptos, estilo, razonamiento — y los usa para producir texto coherente en respuesta a una instrucción (prompt). No "sabe" cosas en el sentido humano: aproxima la respuesta más probable según su entrenamiento, lo que explica tanto su utilidad como sus límites. Familias frontera 2026: Claude (Anthropic), Gemini (Google), GPT (OpenAI), Llama (Meta), Kimi (Moonshot), DeepSeek, MiniMax. Cada modelo viene en varios tamaños (Opus/Sonnet/Haiku, Pro/Flash/Nano…) que cambian coste, latencia y capacidad. La regla operativa StratoAI es no casarse con un modelo: enrutar cada tarea al modelo más barato que aún rinda lo que necesitamos. Un LLM solo no es un producto. Para que aporte valor real necesita contexto (RAG, herramientas, datos del cliente), guardarraíles (validación, evals) y orquestación (workflows, agentes). Esa es la diferencia entre "tener acceso a ChatGPT" y tener un sistema IA en producción.

// Ejemplo en StratoAI

Cómo lo usamos en producción

En el grupo conviven 4 LLMs en producción: Claude Opus 4.7 (1M context) para razonamiento crítico, refactors y copy de marca; Gemini 2.5 Flash para análisis denso barato; MiniMax M2.5 para volumen de contenido (~$0.02/post); Kimi K2.6 como tercer router. La decisión de qué modelo usa cada tarea está codificada en bridge.py por tipo de tarea (content, meta, social, analysis, email).

// Cuándo importa

Para qué te importa esto

Cuando necesitas generar texto, código o análisis a escala con calidad consistente
Cuando un cliente pregunta "¿qué IA usáis?" — la respuesta honesta es varias, según la tarea
Cuando hay que justificar coste por llamada en un proyecto recurrente (volumen mensual × precio modelo)
Cuando una tarea crítica falla con un modelo barato y conviene escalar a uno frontera

// Herramientas del directorio

Donde aplica este término

Claude

Anthropic

El modelo que razona en serio. La columna vertebral del taller.

Gemini

Google DeepMind

El motor de imagen y análisis barato del stack — Nano Banana 2 incluido.

OAI

OpenAI

El otro grande. GPT-5 + GPT Image + Sora viven aquí.

Kimi K2.6

Moonshot AI (China)

El chino serio del 2026 para agentes y código a precio razonable. Uso productivo en el grupo.

MiniMax M2.5

MiniMax (China)

El modelo más barato decente para copy en español productivizado.

// Términos relacionados

Sigue tirando del hilo

TKN

Token

Un token es la unidad mínima de texto que procesa un LLM: aproximadamente una sílaba o un trozo de palabra. El precio por uso, la velocidad y el límite de memoria del modelo se miden todos en tokens, no en palabras ni en caracteres.

CTX

Context window

El context window es la cantidad máxima de tokens (entrada + salida) que un LLM puede manejar en una sola conversación. Funciona como su memoria de trabajo: lo que cabe ahí, el modelo lo "ve"; lo que se sale, lo olvida.

HAL

Alucinación

Hallucination

Una alucinación es una respuesta del LLM que suena plausible pero es falsa o inventada. No es un bug: es una propiedad estructural del modelo, que produce el texto más probable según su entrenamiento, no la respuesta verdadera.

PRO

Prompt engineering

Prompt engineering es el oficio de escribir instrucciones para LLMs que produzcan la salida deseada de forma fiable y reproducible. No es "saber pedir cosas a ChatGPT": es diseñar prompts versionados, evaluados y robustos a fallo en producción.

¿Cómo aplica
esto a tu negocio?

Las definiciones son el primer paso. Convertir el concepto en operación 24/7 dentro de tu empresa es el siguiente. Hablemos en una Contact Call de 30 minutos sin compromiso.

Reservar Contact Call → ← Volver al glosario

LLM