stratoai.pro // directorio-ia // artificial-analysis
AA
// Utilidades transversales

Artificial Analysis

La capa neutral de benchmarks LLM · 512+ modelos comparados en inteligencia, velocidad, precio y openness.

Pricing
Acceso público gratuito a leaderboards · metodología y datasets descargables · sin tier de pago visible
Modelo
Gratis
Evaluación
Evaluación externa
Verificado
4 de mayo de 2026
◆ Veredicto de operador

Artificial Analysis es la referencia de facto en benchmarks independientes de modelos IA. Cubre 512+ LLMs (propietarios y open-weight), generación de imagen, vídeo, voz y rendimiento de 22+ proveedores API, todo en leaderboards públicos con metodología documentada (Intelligence Index v4 con 10 evaluaciones tipo GDPval-AA y GPQA Diamond, Openness Index, AA-Omniscience para alucinación, AA-AgentPerf para workloads agénticos). En ChefBusiness Group + StratoAI todavía es evaluación externa, pero se considera fuente primaria para sustentar decisiones de modelo en sesiones de Strategic Assessment con cliente — cuando alguien pregunta «¿por qué Claude y no GPT?», la tabla comparativa de Artificial Analysis es la respuesta sin sesgo de vendor que necesitamos. Además es candidato directo para extracción periódica con Crawl4AI: el sitio publica los datos en HTML estructurado, sin paywall, perfecto para alimentar dashboards internos de StratoAI con métricas frescas de modelos.

+ Para qué SÍ

  • Sustentar decisiones de modelo en sesiones de Strategic Assessment sin sesgo de vendor (cliente pregunta «¿por qué este LLM?» → tabla AA)
  • Comparar inteligencia · velocidad · precio · openness de 512+ modelos en una sola fuente actualizada
  • Validar antes de comprometer pipelines productivos si un modelo nuevo (Kimi K2.6, DeepSeek V4, gpt-oss) compite con Claude/Gemini/OpenAI
  • Detectar drifts de proveedores API (latencia, throughput) que afectan a clientes Consultor IA con SLA implícito
  • Materia prima para extracción con Crawl4AI hacia dashboards internos StratoAI · datos públicos sin paywall

− Para qué NO

  • Decidir un modelo solo por benchmark sintético — los benchmarks no capturan encaje de tono, estilo ni dominio del caso real
  • Reemplazar pruebas A/B propias en el caso del cliente — AA da el «top 10», la prueba final la haces tú
  • Análisis de modelos verticalizados (médico, legal, código específico) donde benchmarks generalistas no aplican
  • Evaluar coste real de producción donde caching, batching y tier enterprise del vendor cambian la economía vs el precio listado

◇ Encaje en líneas StratoAI

Alternativas reales

Otras herramientas del directorio que cubren parte del mismo problema. Si Artificial Analysis no encaja en tu caso, una de estas probablemente sí.

[ Por qué StratoAI ]

StratoAI es una firma cross-industry de implementación de IA. Cartera activa con clientes de inmobiliario, franquicias de retail especializado, cadenas de restauración (con foco IA, no consultoría gastronómica), arquitectura, distribución B2B, clínicas privadas y ecommerce D2C. Stack real en producción: Claude Code, n8n, agentes operando 24/7, no demos ni slides.

Caso real anonimizado por NDA: Concesión portuaria — diagnóstico, plan de negocio, identidad, renders y web entregados en 15 días, presentado cinco días antes del deadline de la concesión. Ejecutado con Focus Sprint™, la metodología insignia.

¿Quieres encajar Artificial Analysis en tu operación?

Si esta herramienta encaja en tu caso, podemos implementarla en una de las cuatro líneas StratoAI: Signals, Automations, Agentes IA o MicroSaaS. Y si no encaja, te lo decimos sin rodeos. Contact Call de 15 minutos sin compromiso.

// Stack frontera

Modelos que evaluamos · proveedores que operamos

Stack frontera + open-weight · benchmark continuo · sin sesgo de vendor

¿Hablamos? Respondo personalmente John Guerrero · fundador StratoAI