◆ Técnicas

Fine-tuning

También conocido como: Ajuste fino · Reentrenamiento · Especialización del modelo

Fine-tuning es entrenar un LLM ya existente con tus propios datos para que se especialice en una tarea o un estilo concreto. Suena ideal pero rara vez es la solución correcta: en 2026, RAG + buen prompt resuelven el 90% de casos a una fracción del coste.

← Todos los términos Aplicar a mi caso →

// Definición extendida

En fine-tuning partes de un modelo base (Llama, GPT, Claude vía API) y le pasas miles de ejemplos input/output del comportamiento deseado. El modelo ajusta sus pesos para reproducir ese patrón. El resultado es un modelo "tuyo" que aprendió tu estilo, tu vocabulario o una tarea estrecha (clasificación, extracción, formato fijo). El problema del fine-tuning como primera respuesta: necesita dataset de calidad (cientos a miles de ejemplos limpios), infraestructura para entrenar y servir, evals serios para detectar regresiones, y proceso de re-entrenamiento cada vez que cambia el dominio. Cuesta caro montarlo, caro mantenerlo y, en la mayoría de casos PYME, da peor resultado que un buen prompt + RAG con un modelo frontera. Cuándo sí compensa: tareas muy estrechas con volumen masivo (clasificación de millones de tickets, extracción de campos en facturas), cumplimiento estricto de formato, modelos pequeños on-premise por privacidad, o reducir latencia/coste en una tarea que ya está validada con prompting. Si dudas si lo necesitas, casi seguro no lo necesitas todavía.

// Ejemplo en StratoAI

Cómo lo usamos en producción

El grupo no usa fine-tuning en ningún producto en 2026. Todo lo que parecía requerirlo (estilo de marca ChefBusiness, voz John Guerrero, formato ficha producto digital) se resolvió con prompt templates + few-shot examples + RAG sobre la base de contenido existente. Coste: $0 de entrenamiento. Si en algún producto futuro se valida un caso de fine-tuning real, será sobre Llama 4 OSS, no sobre cerrados — para mantener portabilidad y coste.

// Cuándo importa

Para qué te importa esto

Cuando un modelo necesita un formato de salida tan estricto que el prompting no garantiza fiabilidad
Cuando hay volumen tan masivo que el coste por llamada justifica la inversión inicial
Cuando hay restricción de privacidad y el modelo debe correr on-premise (Llama, DeepSeek)
Cuando una primera versión con prompting + RAG ya funciona y solo falta abaratarla

// Herramientas del directorio

Donde aplica este término

OAI

OpenAI

El otro grande. GPT-5 + GPT Image + Sora viven aquí.

Gemini

Google DeepMind

El motor de imagen y análisis barato del stack — Nano Banana 2 incluido.

// Términos relacionados

Sigue tirando del hilo

LLM

Un LLM (Large Language Model) es un modelo de inteligencia artificial entrenado sobre cantidades enormes de texto para predecir la siguiente palabra y, con eso, generar lenguaje, razonar, escribir código y seguir instrucciones.

PRO

Prompt engineering

Prompt engineering es el oficio de escribir instrucciones para LLMs que produzcan la salida deseada de forma fiable y reproducible. No es "saber pedir cosas a ChatGPT": es diseñar prompts versionados, evaluados y robustos a fallo en producción.

RAG

RAG (Retrieval-Augmented Generation) es la técnica de darle a un LLM, antes de responder, los documentos exactos que necesita. El modelo deja de tirar de memoria y cita fuentes reales — más preciso, más barato y siempre actualizado.

EMB

Embeddings

Un embedding es la representación numérica de un texto (o imagen, o audio) en forma de vector. Convierte significado en coordenadas: dos textos parecidos en sentido quedan cerca en el espacio vectorial, aunque usen palabras distintas.

¿Cómo aplica
esto a tu negocio?

Las definiciones son el primer paso. Convertir el concepto en operación 24/7 dentro de tu empresa es el siguiente. Hablemos en una Contact Call de 30 minutos sin compromiso.

Reservar Contact Call → ← Volver al glosario