Tres tamaños, tres trabajos
Claude no es un modelo, es una familia con tres tamaños bien diferenciados. La elección entre ellos cambia el coste 20x y la calidad de razonamiento un escalón completo.
- Claude Opus 4.7 (1M context) — el cerebro de la operación. Razonamiento crítico, refactors grandes, sesiones agénticas largas vía Claude Code, copy de marca donde el matiz importa. Coste alto justificado cuando el output define el día.
- Claude Sonnet 4.6 — el workhorse equilibrado. Tareas serias de código y texto donde Opus es overkill pero MiniMax/Haiku se quedan cortos. El sweet spot para la mayoría de operadores que no necesitan razonamiento extremo.
- Claude Haiku 4.5 — rápido y barato para clasificación, extracción, enrutado de mensajes, primer paso de pipelines. Coste comparable a modelos baratos pero con calidad de comprensión muy superior.
◆ Verdict de operador. Claude es la columna vertebral del taller. Gemini abarata, MiniMax produce volumen, pero Claude es el que decide. La regla del grupo: si la tarea afecta producción crítica o requiere juicio, va a Claude. Si es ruido masivo con quality gate humano posterior, no.
Para qué sirve y para qué no
Para qué SÍ
- Razonamiento crítico de código. Refactors grandes (200+ ficheros), debugs profundos donde hay que entender el porqué, decisiones de arquitectura. Sonnet/Opus mantienen calidad donde otros modelos se inventan APIs o ignoran convenciones del repo.
- Copy en español castellano con matiz cultural. Landings comerciales, posts pilar, comunicación delicada. Claude entiende registro, tono, ironía y contexto cultural de manera que ni Gemini ni MiniMax igualan.
- Sesiones agénticas largas vía Claude Code. Mover proyectos en producción durante horas con un operador al frente — el modelo no se rompe, mantiene el hilo, ejecuta y verifica.
- Context window enorme. Opus 4.7 con 1M tokens permite cargar repos enteros, documentación masiva, propuestas largas (60-120 páginas) en una sola llamada. Cambia la economía del razonamiento sobre código existente.
- Tool use de calidad. Cuando construyes agentes que llaman herramientas (MCP, function calling, browser automation), Claude sigue siendo el más fiable a la hora de invocar el tool correcto con los argumentos correctos.
Para qué NO
- Volumen masivo barato. Si vas a generar 100 posts/mes, no uses Claude para redactar — usa MiniMax (~$0.02/post) y deja Claude para la revisión final. La regla #1 del CLAUDE.md global del grupo es explícita: Opus no redacta, orquesta.
- Análisis denso de documentos genéricos. Para resúmenes, sentiment, clasificación a escala, Gemini Flash es 5x más barato y suficiente.
- Generación de imágenes. Anthropic no es proveedor de imagen — ir a Nano Banana 2 (Gemini), Midjourney o Ideogram.
- Rate limits agresivos sin pagar tier alto. Claude prioriza calidad sobre throughput barato; si tu app necesita 1000 req/s con coste mínimo, mira otras opciones.
Encaje en stack StratoAI
Claude es infraestructura transversal del stack, no una pieza de un servicio concreto. Aparece en las cinco líneas:
| Línea StratoAI | Cómo se usa |
|---|---|
| Signals | Síntesis crítica del corpus rastreado por Firecrawl. Decide qué señales son relevantes y cómo presentarlas. |
| Automations | Lógica de decisión dentro de workflows n8n cuando un nodo necesita juicio (no solo análisis). |
| Agentes IA | Modelo base para los agentes con tool use serio (browser, search, MCP). Sonnet/Opus dominan tool calling. |
| MicroSaaS | Redacción de copy crítico, refactors grandes, decisiones de arquitectura del producto entregado. |
| Consultor IA | El cerebro del Strategic Assessment y del Focus Sprint. Audita stacks, propone roadmap, redacta entregables. |
Pricing real (2026-05)
Vía API directa Anthropic
- Claude Haiku 4.5 · $0.80/M tokens input · $4/M output. Una clasificación o extracción cuesta ~$0.005. El más barato de la familia.
- Claude Sonnet 4.6 · $3/M input · $15/M output. Una tarea media de código o texto cuesta ~$0.05-0.20.
- Claude Opus 4.7 (1M context) · $15/M input · $75/M output. Una sesión seria de razonamiento sobre repo grande cuesta $1-5. Justificado cuando el output mueve la aguja.
- Caché de prompts · descuentos importantes en tokens cacheados (>50% input). Crítico para sesiones largas con contexto repetido.
Vía suscripción Claude.ai + Claude Code
- Pro · 20€/mes — uso ligero web + Claude Code limitado.
- Max 5x · 100€/mes — sweet spot para operadores serios.
- Max 20x · 200€/mes — sesiones largas multi-proyecto con Opus en uso intensivo. Lo que usa John Guerrero en ChefBusiness Group y StratoAI.
Vía proveedores cloud
- AWS Bedrock · pricing similar API directa, con SLA enterprise + data residency.
- Google Vertex AI · idem, útil si tu org ya está en GCP.
Alternativas reales
| Alternativa | Cuándo elegirla en lugar de Claude |
|---|---|
| Gemini (Google) | Análisis denso barato (Flash 2.5 es 5x más barato). Imágenes (Nano Banana 2). Multimodal con Files API. |
| MiniMax M2.5 | Volumen masivo de copy en español a $0.02/post con quality gate humano posterior. |
| GPT-5 / GPT-4.1 (OpenAI) | Si tu org ya está casada con OpenAI por contrato/política. Calidad comparable en muchas tareas, peor en código según versión. |
| Kimi K2 (Moonshot) | Si necesitas open-weight de calidad y context window largo a precio chino. Pendiente de validación seria en producción del grupo. |
| Llama 4 / Qwen 3 / DeepSeek V4 | Open source cuando necesitas runtime local, compliance estricto o coste cero por inferencia (asumiendo infra propia). |
Casos de uso reales en ChefBusiness Group + StratoAI
- Operación diaria de 12+ dominios vía Claude Code (Opus 4.7 1M context). Plan Max 20x · CLAUDE.md por proyecto · regla #1 hardcoded para nunca filtrar API keys. Es la herramienta principal del taller.
- Construcción de stratoai.pro v1 completa. 5 briefs técnicos + 23 fichas del directorio + mega menú unificado + pivote cross-industry — todo en sesiones Claude Code con Opus.
- Refactor catálogo de 33 productos digitales chefbusiness.co a fuente única. Commits
714d48a+f3b4707. Imposible de hacer en una tarde sin Opus manteniendo el contexto del repo entero. - Auditoría preventiva post-incidente aichef.pro 29-abril. Comparación cross-repo de los dos bugs (access gates + paths rotos) entre aichef.pro y chefbusiness.co — 30 minutos con Claude Code, vs medio día auditando manualmente.
- Copy crítico de landings ChefBusiness. Las páginas de productos digitales y planes de negocio (33 + 10 LIVE) llevan copy donde el matiz castellano España es producto. Claude redacta, MiniMax sería un downgrade visible.
◇ Regla de uso operativo. Claude no se delega para copy masivo (regla #1 del grupo). Se reserva para juicio: razonamiento crítico, refactors grandes, copy de marca, sesiones agénticas. Para volumen, usar MiniMax con quality gate. Para análisis denso barato, Gemini Flash. La economía del stack se rompe si pones Opus a redactar 50 posts al mes.