IA Seguridad Software Tecnología Anthropic afirma que Project Glasswing detectó más de 10. 000 fallas críticas con IA Por Canuto Anthropic aseguró que su iniciativa Project Glasswing ya permitió detectar más de 10. 000 vulnerabilidades de gravedad alta o crítica en software clave para internet e infraestructura esencial. El anuncio sugiere un cambio profundo en ciberseguridad: encontrar fallas empieza a ser mucho más rápido que verificarlas, divulgarlas y corregirlas. *** Anthropic dijo que sus socios hallaron más de 10. 000 vulnerabilidades altas o críticas usando Claude Mythos Preview. En más de 1. 000 proyectos de código abierto, la compañía estimó 6.
202 fallas graves y validó 1. 587 hallazgos como verdaderos positivos. La empresa advirtió que el nuevo cuello de botella ya no es descubrir errores, sino clasificarlos, reportarlos y desplegar parches a tiempo. Descubren 10,000 vulnerabilidades críticas con IA Anthropic reporta que su Project Glasswing, en colaboración con 50 socios, identificó más de 10,000 fallas en software clave. La rapidez en detectar fallas supera ahora a la de corregirlas. Empresas como Cloudflare y… pic. .

com/8tNxLmHoHs — Diario฿itcoin (@DiarioBitcoin) May 23, 2026 La firma de IA Anthropic presentó una actualización inicial de Project Glasswing, su programa colaborativo orientado a reforzar software crítico antes de que modelos cada vez más capaces puedan ser utilizados en su contra. Según la compañía, en apenas un mes de trabajo junto a unos 50 socios, Claude Mythos Preview ayudó a encontrar más de 10. 000 vulnerabilidades de gravedad alta o crítica en algunos de los sistemas más relevantes para el funcionamiento de internet y otra infraestructura esencial. El dato central no solo apunta a un salto en capacidad técnica.
También expone un cambio estructural en la ciberseguridad moderna. Si antes el reto principal era descubrir nuevas fallas, ahora el problema es mucho más operativo: verificar cuáles son reales, reportarlas con cuidado, desarrollar parches y lograr que esos arreglos se implementen antes de que actores maliciosos aprovechen la ventana de exposición. Para un público que sigue de cerca la IA, este avance tiene un doble filo. Por un lado, promete software más seguro a largo plazo. Por otro, eleva el riesgo durante una etapa de transición en la que las máquinas pueden detectar y, potencialmente, explotar errores a una velocidad mayor que la capacidad humana para responder.

En su informe Project Glasswing: An initial update , Anthropic explicó que todavía no puede detallar buena parte de los hallazgos por razones de divulgación coordinada. La práctica habitual de la industria establece que nuevas vulnerabilidades se publiquen 90 días después de ser descubiertas, o cerca de 45 días después de que haya un parche disponible, para dar tiempo a que los usuarios actualicen sus sistemas. Los primeros resultados de Project Glasswing Anthropic señaló que la mayoría de sus socios iniciales, entre ellos desarrolladores y mantenedores de software esencial para la infraestructura digital, ya encontró cientos de vulnerabilidades altas o críticas cada uno.
En conjunto, el total superó las 10. 000. Varias organizaciones, afirmó la empresa, reportaron que su ritmo de detección de errores aumentó más de diez veces. Uno de los ejemplos más concretos fue Cloudflare. De acuerdo con los datos citados por Anthropic, esa empresa localizó 2. 000 errores en sistemas de ruta crítica, de los cuales 400 fueron clasificados como de gravedad alta o crítica. Además, el equipo de Cloudflare consideró que la tasa de falsos positivos del modelo fue mejor que la de evaluadores humanos. La actualización también incluyó referencias a pruebas y evaluaciones de terceros.

El Instituto de Seguridad de la IA del Reino Unido reportó que Mythos Preview fue el primer modelo en resolver de extremo a extremo sus dos cyber ranges, que son simulaciones de ciberataques de múltiples pasos. Mozilla, por su parte, encontró y corrigió 271 vulnerabilidades en Firefox 150 al probar el modelo, una cifra que la compañía comparó con un resultado superior a diez veces lo observado antes con Claude Opus 4. 6 en Firefox 148. Anthropic agregó que la plataforma independiente de seguridad XBOW describió a Mythos Preview como un avance significativo sobre los modelos existentes en su benchmark de explotación web, con una precisión sin precedentes token por token.
A esto se suman ExploitBench y ExploitGym, dos benchmarks académicos recientes para medir la capacidad de los modelos al desarrollar exploits, donde Mythos Preview también apareció como el mejor desempeño. Más allá de la detección, la empresa sostuvo que ya observa un aumento en el ritmo de despliegue de parches. Citó que la última versión de Palo Alto Networks incluyó más de cinco veces más correcciones de lo habitual. También mencionó que Microsoft anticipó una tendencia creciente en el volumen de nuevos parches, mientras Oracle estaría encontrando y corrigiendo vulnerabilidades varias veces más rápido que antes. El modelo también fue útil en otras tareas de seguridad.
Etiquetas: Tecnología, OpenAI, ChatGPT, Anthropic, ciberseguridad, vulnerabilidades, Project Glasswing, Tecnología · OpenAI, ChatGPT y Anthropic
