Vector database
Cómo lo usamos en producción
Para qué te importa esto
- Cuando montas un RAG y necesitas servir respuestas en tiempo real
- Cuando quieres búsqueda semántica interna en tu app (más allá de un like en SQL)
- Cuando comparas precios — pgvector puede ser 10-100x más barato que managed para volúmenes pequeños/medios
- Cuando un proveedor managed te bloquea — la portabilidad de los embeddings + esquema importa
Donde aplica este término
Sigue tirando del hilo
Embeddings
Un embedding es la representación numérica de un texto (o imagen, o audio) en forma de vector. Convierte significado en coordenadas: dos textos parecidos en sentido quedan cerca en el espacio vectorial, aunque usen palabras distintas.
RAG
RAG (Retrieval-Augmented Generation) es la técnica de darle a un LLM, antes de responder, los documentos exactos que necesita. El modelo deja de tirar de memoria y cita fuentes reales — más preciso, más barato y siempre actualizado.
LLM
Un LLM (Large Language Model) es un modelo de inteligencia artificial entrenado sobre cantidades enormes de texto para predecir la siguiente palabra y, con eso, generar lenguaje, razonar, escribir código y seguir instrucciones.
API
Una API (Application Programming Interface) es la puerta de entrada que expone un servicio para que otros programas la usen. En el contexto IA, "consumir la API de Claude" significa enviar peticiones HTTP autenticadas a Anthropic y recibir respuestas del modelo, en vez de usar la web de chat.
¿Cómo aplica
esto a tu negocio?
Las definiciones son el primer paso. Convertir el concepto en operación 24/7 dentro de tu empresa es el siguiente. Hablemos en una Contact Call de 30 minutos sin compromiso.