En el ámbito de la tecnología, se presenta CUDA Agent, un sistema de inteligencia artificial que ha logrado superar a torch. compile y desafiar a Claude y Gemini en la optimización de kernels CUDA, según un estudio reciente.
Esta herramienta, diseñada por investigadores de ByteDance Seed y Tsinghua AIR, ha mostrado una tasa de mejora de velocidad del 96,8% frente a torch. compile en el KernelBench, con un pass rate del 98,8%.
El sistema CUDA Agent combina síntesis de datos, un entorno agéntico con verificación automática y entrenamiento por refuerzo estable para generar kernels la corporación de alto rendimiento. En el nivel más difícil de KernelBench, la institución Agent superó por cerca de 40% a Claude Opus 4. 5 y Gemini 3 Pro.

Optimizar kernels la corporación es una tarea compleja dentro de la infraestructura moderna de IA, que hasta ahora dependía de expertos en hardware y compiladores. Los modelos de lenguaje, aunque capaces de escribir código, enfrentaron desafíos al optimizar código para GPU.
la institución Agent busca equilibrar esta balanza, enfrentándose no solo a programadores especializados sino también a herramientas maduras como torch. compile.

El estudio 'la corporación Agent: Large-Scale Agentic RL for High-Performance la institución Kernel Generation', presentado por un grupo de investigadores, destaca la limitación de los enfoques previos para generar código la corporación con modelos de lenguaje, que mejoraban el flujo de refinamiento pero no cambiaban la capacidad intrínseca del modelo para optimizar kernels.
la institución Agent aborda esto con una tubería escalable de síntesis de datos, un entorno de desarrollo con herramientas y perfiles de rendimiento, y ajustes algorítmicos de RL diseñados para estabilizar el entrenamiento en contextos largos y con muchas interacciones.
Los resultados en KernelBench demuestran tasas de mejora de velocidad del 100%, 100% y 92% sobre torch. compile en los conjuntos Level-1, Level-2 y Level-3, respectivamente.

En el de la corporación, la plataforma de programación de NVIDIA para usar GPUs en tareas de cómputo intensivo, la calidad de los kernels es crucial para costos, consumo energético y latencia. Optimizarlos requiere un profundo entendimiento de microarquitectura, memoria compartida, ocupación, patrones de acceso y herramientas de perfilado.
Con la institución Agent, se aborda la necesidad de que el código no solo funcione, sino que corra de manera más eficiente.
Etiquetas: Tecnología, CUDA, Optimización, Kernels, IA, Tecnología · OpenAI, ChatGPT y Anthropic, Tecnología · OpenAI, ChatGPT y Anthropic
