2026-05-29T11:17:10Z Javier Pastor Editor Senior – Tech Javier Pastor Editor Senior – Tech Linkedin 10048 publicaciones de Javier Pastor No lo esperábamos tan pronto, pero aquí está Claude Opus 4. 8 , la nueva versión del modelo frontera de Anthropic. Han pasado tan solo 41 días desde el lanzamiento de Claude Opus 4. 7 , lo que parece dejar claro que la empresa no estaba del todo contenta con dicho modelo, que no acabó tampoco de conquistar muy buenas críticas. Con Claude Opus 4. 8 lo realmente curioso no es que vuelva a establecer récords en la mayoría de benchmarks. La sorpresa es su honestidad. Es mejor, sí, pero es no es lo que importa .
En los resultados internos de los benchmarks publicados por Anthropic queda claro que Opus 4. 8 está por encima de Opus 4. 7, pero también de GPT 5. 5 y de Gemini 3. 1 Pro (curioso, no lo comparan con el reciente Gemini 3. 5 Flash. Supera a todos ellos en esas pruebas salvo en TerminalBench 2. 1, en la que GPT-5. 5 es algo superior. Es en realidad esperable que cada nuevo modelo supere a su antecesor, pero aquí lo llamativo es el enfoque del modelo. Honestidad ante todo . Boris Cherny, máximo responsable de Claude Code en Anthropic, explicaba que el modelo no solo programa mejor: "es significativamente más honesto sobre su propio trabajo.

Te dice cuándo no está seguro de algo y detecta sus propios fallos en lugar de declarar demasiado pronto la victoria". Solo sé que no sé nada . Otra de las ingenieras de Anthropic, Catherine Wu, incidía en esa nueva "personalidad" de Claude Opus 4. 8, que es capaz de admitir que no sabe algo en lugar de contestar por contestar y de pasar por alto errores en sus respuestas o en el código que genera. Quienes lo han probado coinciden en que es un modelo más "alineado", es decir, que se ajusta a los valores, intenciones, éticas y objetivos humanos. Menos alucinaciones, más humanidad .

Desde hace tiempo estamos viendo cómo los nuevos modelos de IA son mejores en benchmarks, pero también ha habido saltos significativos en la disminución de alucinaciones. No solo inventan y se equivocan menos: comienzan a reconocer que no lo saben todo. Eso es muy importante… y muy humano. La completísima "Tarjeta de Sistema" incluye numerosas métricas que desde luego parecen demostrar que estamos ante un modelo mucho más pulido que sus antecesores en este ámbito. Flujos de trabajo .

Una de las novedades presentadas junto al modelo son los flujos de trabajo dinámicos (Dynamic Workflows), que están disponibles en versión preliminar y que están orientados a una sola cosa: lograr trabajar con tareas más
Etiquetas: Tecnología · OpenAI, ChatGPT y Anthropic, Tecnología · OpenAI, ChatGPT y Anthropic
