Dos modelos, dos roles
Gemini no es un modelo, es una familia. Dentro del stack StratoAI tiene dos papeles bien definidos:
- Gemini Flash 2.5 — análisis denso barato. Auditorías SEO, parsing de documentos, generación de meta descriptions, emails transaccionales, reports. Coste ~$0.03 por llamada media.
- Gemini 3.1 Flash Image Preview (a.k.a. «Nano Banana 2») — generación de imagen profesional brand-consistent. Reemplaza Midjourney + Ideogram en el flow de ChefBusiness Group y StratoAI. Coste ~$0.07/imagen.
Para todo lo demás —razonamiento crítico de código, copy en español con matiz cultural, contexto largo conversacional— Claude y MiniMax cubren mejor.
Mapa completo de modelos Gemini (2026-05)
Gemini se ha convertido en una familia ancha que cubre texto, imagen, vídeo y embeddings. Los que importan a un operador serio en 2026 son seis:
| Modelo | Rol principal | Context | Coste API (orientativo) | Estado en stack |
|---|---|---|---|---|
| Gemini 3 Pro | Razonamiento serio, multimodal alto, alternativa a Claude Opus para casos donde Anthropic no encaja | 1M+ tokens | ~$2.50/M input · ~$15/M output | Fallback de razonamiento cuando Claude no cubre |
| Gemini 3 Flash | Workhorse equilibrado nueva generación, sustituye 2.5 Flash en pipelines nuevos | 1M tokens | ~$0.30/M input · ~$2.50/M output | Migración progresiva desde Flash 2.5 |
| Gemini Flash 2.5 | Análisis denso barato actualmente en producción del grupo (audit_seo · meta · reports · email) | 1M tokens | $0.075/M input · $0.30/M output | Uso-en-producción · vía bridge.py task=analysis |
| Gemini 3 Flash Lite | Tareas de altísimo volumen donde el coste por llamada importa por encima de todo | 1M tokens | ~$0.04/M input · ~$0.20/M output | Candidato para signals masivos · evaluación |
| Gemini 3.1 Flash Image Preview (Nano Banana 2) | Generación masiva de imágenes hero brand-consistent de los 7+ dominios del grupo | n/a | ~$0.07/imagen 1024×1024 | Uso-en-producción · ~600 imágenes generadas |
| Gemini Image Pro (Nano Banana Pro) | Generación premium de imagen — mayor fidelidad de estilo, control fino, edición conversacional | n/a | ~$0.20-0.40/imagen | Evaluación externa · candidato para hero «hero del hero» de landings clave |
| Gemini Veo 3 | Generación de vídeo corto (anuncios producto, social ads) — alternativa a Sora/Runway | n/a | ~$0.50/segundo de vídeo | Evaluación externa · sin uso productivo aún |
Hay además línea de embeddings (text-embedding-004 y siguientes) útiles para vector search en signals/RAG, y los modelos legacy (Gemini 1.5 / 2.0) que conviene migrar hacia 2.5/3.x cuando sea posible.
◇ Regla de uso operativo. Pin la versión exacta del modelo en cada llamada (gemini-2.5-flash no gemini-flash). Google itera versiones rápido y los prompts pueden dejar de comportarse igual sin aviso. La regla #1 del grupo aplica con fuerza extra a Gemini: nunca hardcodear GEMINI_API_KEY en código, siempre os.environ.get('GEMINI_API_KEY').
◆ Verdict de operador. Gemini no es el modelo que te resuelve la vida; es el modelo que abarata tu stack en un 60-70%. La regla CLAUDE.md global del grupo lo deja claro: análisis y email vía Gemini Flash; imágenes vía Nano Banana 2; el resto a Claude o MiniMax según caso.
Para qué sirve y para qué no
Para qué SÍ
- Generación masiva de imágenes hero brand-consistent. Nano Banana 2 con prompts brutalist + alt text en español. Ya hay 600+ imágenes generadas en producción del grupo.
- Análisis denso de documentos largos. Files API + 1M tokens permite cargar PDFs enteros (propuestas, briefings, normativas) y extraer en una llamada. Hace inviable a competidores con context window pequeño.
- Pipelines SEO automatizados.
audit_seo.pyde gastroseo.com usa Gemini Flash para auditar posts, detectar canibalización, sugerir titles. Coste por auditoría ~$0.05. - Multimodal real. Vídeo + audio + texto en mismo prompt. Útil para review automático de demos de producto.
- Free tier generoso para PoC. Antes de escalar puedes validar ideas sin pagar nada.
Para qué NO
- Copy en español castellano con matiz cultural. Gemini tiende a dar resultado correcto-pero-genérico. Para
chefbusiness.coy posts SEO en castellano España, MiniMax es más decente y Claude más preciso. - Razonamiento de código serio. Para refactors complejos, debug profundo o arquitectura, Claude Sonnet/Opus siguen ganando.
- Estabilidad de comportamiento. Google itera versiones rápido y a veces los prompts dejan de funcionar igual. Para producción crítica, fija version explícita y monitoriza output.
- Compliance estricto sin Vertex AI. El endpoint público AI Studio no garantiza data residency. Para clientes en sectores regulados, hay que pasar por Vertex.
Encaje en stack StratoAI
| Línea StratoAI | Cómo se usa |
|---|---|
| Signals | Análisis Flash 2.5 sobre texto extraído por Firecrawl (resúmenes, sentiment, clasificación). |
| Automations | Workflows n8n con nodo HTTP llamando a Gemini Flash para análisis baratos en cadena. |
| MicroSaaS | Generación de imágenes brand-consistent del producto entregado al cliente (hero, OG, redes). |
| Transversal | Imágenes del propio sitio StratoAI, ChefBusiness, GastroSEO, Hosply. ~600 imágenes en producción. |
Pricing real (2026-05)
- Free tier · cuota generosa para PoC, suficiente para validar ideas antes de escalar.
- Gemini Flash 2.5 API · $0.075/M tokens input · $0.30/M tokens output. Una llamada media de análisis cuesta ~$0.03.
- Gemini 2.5 Pro · $1.25/M input · $10/M output. Para razonamiento más serio cuando Claude no encaja por algún motivo.
- Nano Banana 2 (3.1 Flash Image Preview) · ~$0.07/imagen 1024×1024. Las 16:9 brutalist de StratoAI van con prompts de 80-150 palabras.
- Vertex AI · pricing similar pero con SLA enterprise + data residency Europa.
Comparativa real: el mismo análisis en Claude Sonnet costaría 3-5x más; en GPT-4o costaría 4-6x más. Esa es la razón de existencia de Gemini Flash en el stack.
Alternativas reales
| Alternativa | Cuándo elegirla en lugar de Gemini |
|---|---|
| Claude (Anthropic) | Razonamiento serio, copy en español de calidad, código complejo. |
| MiniMax M2.5 | Copy en español decente al precio más barato del mercado (~$0.02/post). |
| GPT-4o / GPT-4.1 | Si tu org ya está casada con OpenAI por razones políticas o de contrato. |
| Midjourney / Ideogram | Imágenes con valor artístico alto. Para brand-consistent industrial Nano Banana 2 gana en velocidad y coste. |
Casos de uso reales en ChefBusiness Group + StratoAI
- Nano Banana 2 produciendo ~600 imágenes hero brand-consistent en 7 dominios del grupo siguiendo
IMAGENES_MAESTRO.mdpor proyecto. - Pipeline blog ChefBusiness · meta description vía bridge.py(MiniMax) + 3 imágenes vía Gemini Image Preview por post. Coste por post ~$0.30.
- audit_seo.py de gastroseo · Gemini Flash audita estructura, headings, internal linking. Sesión 2026-04-15 generó 16 commits con fixes basados en su output.
- Recovery posts legacy 404 sesión 2026-04-18 en gastroseo · cuando MiniMax falló en español castellano gastro, fallback automático a Gemini Flash recuperó ~58.700 impresiones de 404s.
- Análisis Files API de PDFs comerciales · propuestas largas (60-120 páginas) parseadas en una sola llamada para extraer requisitos y dimensionar Focus Sprint.
◇ Regla de uso operativo. Nunca hardcodear GEMINI_API_KEY en código. Siempre os.environ.get('GEMINI_API_KEY'). La regla #1 del grupo se aplica con fuerza extra a Gemini porque Google rota keys agresivamente al detectar leaks.