◆ Técnicas

Embeddings

También conocido como: Vector embeddings · Vectores semánticos · Representaciones vectoriales

Un embedding es la representación numérica de un texto (o imagen, o audio) en forma de vector. Convierte significado en coordenadas: dos textos parecidos en sentido quedan cerca en el espacio vectorial, aunque usen palabras distintas.

← Todos los términos Aplicar a mi caso →

// Definición extendida

Un modelo de embeddings — distinto del LLM, aunque a menudo del mismo proveedor — toma un fragmento de texto y devuelve un vector de 768, 1024, 1536 o más dimensiones. La magia es que ese vector captura el sentido: "restaurante" y "bistró" quedan cerca; "restaurante" y "lavadora" quedan lejos. Eso permite hacer búsqueda semántica, no solo búsqueda por palabras. Los embeddings son la pieza fundacional del RAG y de muchos otros sistemas: búsqueda interna ("encuentra contenido parecido a este"), clustering (agrupar tickets de soporte por tema), detección de duplicados (¿estos dos posts dicen lo mismo?), recomendación ("usuarios que leyeron X también leyeron Y") y clasificación zero-shot. Lo bonito: una vez generados, están bajo tu control en una base de datos, no dependen de seguir llamando al modelo. Decisiones operativas que importan: qué modelo de embeddings (OpenAI text-embedding-3, Gemini text-embedding-004, Voyage, Cohere — cambia precio y calidad), qué tamaño de chunk (frases, párrafos, secciones), qué dimensiones (más dimensiones = más precisión + más coste de almacenamiento), y qué métrica de distancia (coseno suele ganar). Mezclar embeddings de modelos distintos en el mismo índice no funciona: hay que normalizar el pipeline.

// Ejemplo en StratoAI

Cómo lo usamos en producción

En el plan SEO del grupo, antes de publicar un post nuevo en chefbusiness.blog se calcula el embedding del título + meta y se compara con los 285 posts ya publicados. Si la similitud coseno con algún post existente supera 0.85, salta alerta de canibalización SEO y se replantea el ángulo o se actualiza el post viejo. Coste de cada chequeo: $0.0001. Decisión que ahorra: meses de canibalización SEO entre posts hermanos.

// Cuándo importa

Para qué te importa esto

Cuando montas un RAG y necesitas que recupere por significado, no por palabra exacta
Cuando quieres detectar duplicados o canibalización SEO entre tu propio contenido
Cuando clasificas grandes volúmenes (tickets, leads, productos) sin etiquetar uno a uno
Cuando necesitas búsqueda interna que entienda sinónimos sin mantener un diccionario

// Herramientas del directorio

Donde aplica este término

OAI

OpenAI

El otro grande. GPT-5 + GPT Image + Sora viven aquí.

Gemini

Google DeepMind

El motor de imagen y análisis barato del stack — Nano Banana 2 incluido.

SUP

Supabase

Supabase Inc.

Postgres con superpoderes · backend de MicroSaaS sin escribir backend.

// Términos relacionados

Sigue tirando del hilo

RAG

RAG (Retrieval-Augmented Generation) es la técnica de darle a un LLM, antes de responder, los documentos exactos que necesita. El modelo deja de tirar de memoria y cita fuentes reales — más preciso, más barato y siempre actualizado.

VDB

Vector database

Una vector database es una base de datos optimizada para guardar embeddings y buscar el más parecido a una consulta. Es la pieza que convierte "millones de documentos" en "los 5 fragmentos relevantes a esta pregunta" en milisegundos.

LLM

Un LLM (Large Language Model) es un modelo de inteligencia artificial entrenado sobre cantidades enormes de texto para predecir la siguiente palabra y, con eso, generar lenguaje, razonar, escribir código y seguir instrucciones.

PRO

Prompt engineering

Prompt engineering es el oficio de escribir instrucciones para LLMs que produzcan la salida deseada de forma fiable y reproducible. No es "saber pedir cosas a ChatGPT": es diseñar prompts versionados, evaluados y robustos a fallo en producción.

¿Cómo aplica
esto a tu negocio?

Las definiciones son el primer paso. Convertir el concepto en operación 24/7 dentro de tu empresa es el siguiente. Hablemos en una Contact Call de 30 minutos sin compromiso.

Reservar Contact Call → ← Volver al glosario