◆ Stack e integración

Vector database

También conocido como: Base de datos vectorial · Vector store · Vector DB

Una vector database es una base de datos optimizada para guardar embeddings y buscar el más parecido a una consulta. Es la pieza que convierte "millones de documentos" en "los 5 fragmentos relevantes a esta pregunta" en milisegundos.

← Todos los términos Aplicar a mi caso →

// Definición extendida

El reto técnico es encontrar el vector más cercano entre millones, sin recorrerlos todos. Las vector DB usan algoritmos de búsqueda aproximada (HNSW, IVF, ScaNN) que sacrifican un poco de exactitud a cambio de velocidad x1000. La consulta típica devuelve los top-k vectores más similares en menos de 100ms, sobre catálogos de cientos de millones. Players 2026: Pinecone (managed estándar), Weaviate (open-source con cliente fuerte), Qdrant (open-source rápido, self-hosted), Chroma (ligero para prototipos), Milvus (escala enterprise), pgvector (extensión PostgreSQL — la opción más barata si ya tienes Postgres), Supabase (Postgres con pgvector + auth + storage en uno). Cada uno cubre un sweet spot distinto en coste, latencia, volumen y operativa. La decisión vector DB rara vez es la decisión que rompe un proyecto. Lo que sí rompe proyectos es elegir una managed cara cuando bastaba pgvector, o montar Milvus self-hosted cuando bastaba Pinecone. La regla operativa: empezar con pgvector/Supabase si ya hay Postgres en el stack, escalar a managed solo cuando los números lo pidan.

// Ejemplo en StratoAI

Cómo lo usamos en producción

Todos los proyectos del grupo que necesitan vector search usan Supabase con pgvector. Es 1 servicio (no 1 servicio por DB + 1 por vector store + 1 por auth), tiene plan gratis generoso, y permite mezclar SQL relacional con búsqueda semántica en la misma query. Volumen actual: 285 posts blog ChefBusiness + 326 fichas Hosply + 33 productos digitales — todos indexados en Supabase, latencia <50ms.

// Cuándo importa

Para qué te importa esto

Cuando montas un RAG y necesitas servir respuestas en tiempo real
Cuando quieres búsqueda semántica interna en tu app (más allá de un like en SQL)
Cuando comparas precios — pgvector puede ser 10-100x más barato que managed para volúmenes pequeños/medios
Cuando un proveedor managed te bloquea — la portabilidad de los embeddings + esquema importa

// Herramientas del directorio

Donde aplica este término

SUP

Supabase

Supabase Inc.

Postgres con superpoderes · backend de MicroSaaS sin escribir backend.

// Términos relacionados

Sigue tirando del hilo

EMB

Embeddings

Un embedding es la representación numérica de un texto (o imagen, o audio) en forma de vector. Convierte significado en coordenadas: dos textos parecidos en sentido quedan cerca en el espacio vectorial, aunque usen palabras distintas.

RAG

RAG (Retrieval-Augmented Generation) es la técnica de darle a un LLM, antes de responder, los documentos exactos que necesita. El modelo deja de tirar de memoria y cita fuentes reales — más preciso, más barato y siempre actualizado.

LLM

Un LLM (Large Language Model) es un modelo de inteligencia artificial entrenado sobre cantidades enormes de texto para predecir la siguiente palabra y, con eso, generar lenguaje, razonar, escribir código y seguir instrucciones.

API

Una API (Application Programming Interface) es la puerta de entrada que expone un servicio para que otros programas la usen. En el contexto IA, "consumir la API de Claude" significa enviar peticiones HTTP autenticadas a Anthropic y recibir respuestas del modelo, en vez de usar la web de chat.

¿Cómo aplica
esto a tu negocio?

Las definiciones son el primer paso. Convertir el concepto en operación 24/7 dentro de tu empresa es el siguiente. Hablemos en una Contact Call de 30 minutos sin compromiso.

Reservar Contact Call → ← Volver al glosario