2026-06-09T15:30:16Z Javier Pastor Editor Senior – Tech Javier Pastor Editor Senior – Tech Linkedin 10074 publicaciones de Javier Pastor A quienes descartan a Apple en la carrera de la IA , ojito. Puede que la empresa haya llegado tarde y desde luego puede que a día de hoy tenga poco que mostrar, pero su evolución en los últimos tres años revela tres cosas interesantes. La primera, que Apple sí tiene sus propios modelos de IA. La segunda, que están muy lejos en rendimiento de los mejores de OpenAI y Claude. La tercera, que puede que eso no importe en absoluto. Tres años de evolución .
La trayectoria de los documentos técnicos compartidos por Apple en los últimos años revela una serie de cambios más que relevantes. En 2024 su propuesta inicial se limitaba a modelos pequeños de unos 3. 000 millones de parámetros (3B) especializados en resolver tareas básicas como generar Genmojis o resúmenes de texto. En 2025 la compañía lanzó su framework MLX a la comunidad de desarrolladores para facilitar la integración y uso de modelos locales.
Ahora, en 2026, plantean una una infraestructura híbrida basada en un principio básico: Peticiones sencillas: se ejecutan en pequeños modelos locales en el dispositivo, no necesitas ni una conexión a internet Peticiones complejas: el sistema delega la tarea para que se procese en la nube de forma privada a través de la Private Cloud Compute Una idea (quizás) genial: la NAND puede ayudar . El hito más relevante del nuevo enfoque de Apple reside en el diseño de su modelo AFM 3 Core Advanced.

En los móviles actuales tenemos un gran cuello de botella con la ejecución de modelos de IA capaces (grandes) porque estos dispositivos tienen una cantidad de memoria muy limitada (12 GB en algunos iPhone). Para lograr meter un modelo de 20. 000 millones de parámetros (20B), a Apple se le ha ocurrido almacenar ese modelo en la unidad SSD interna, no en memoria. En el modelo AFM 3 Core Advanced los "expertos" están en el SSD del móvil. Se preseleccionan y se cargan en RAM para usarlos de forma dinámica, optimizando la ejecución del modelo. Expertos por prompt, no por token .
Luego activa una serie de técnicas de poda (Instruction-Following Pruning, o IFP) para activar únicamente entre 1. 000 y 4. 000 millones de parámetros de forma dispersa ( sparse ), de forma algo parecida a como se hace en modelos con arquitectura Mixture-of-Experts. Pero Apple selecciona a esos expertos al inicio de cada prompt, no token a token, lo que permite esquivar la lentitud del ancho de banda del almacenamiento NAND del móvil frente a su memoria RAM. Privacidad por bandera . Si por algo destacó el enfoque de Apple desde el principio fue por su privacidad , que está implícita al usar modelos locales.

Pero si la petición es compleja, el sistema la redirige a los modelos de IA en la nube de Apple, la Private Cloud Compute (PCC). A diferencia de otras plataformas e infraestructuras como las de OpenAI o Anthropic, las conversaciones con la IA de Apple están cifradas y son totalmetne privadas según la empresa: esos datos no se comparten con terceros (porque ni Apple puede verlos) y tampoco se usan para entrenar sus modelos.
⌛️ SORTEO ACTIVO EN XATAKA XTRA Esta Nintendo Switch 2 podría ser tuya Suscríbete por solo 2€/mes hasta el 19 de junio y entra en el sorteo En Xataka Siri AI es oficial, pero en Europa vamos a tener que esperar: el DMA vuelve a interponerse entre Apple y Europa Cinco modelos con ayuda de Gemini . Aunque Apple está obsesionada con el control total de sus productos, en esta ocasión tuvo que ceder y aliarse con Google para que sus modelos Gemini pudieran "enseñarle" a Apple el camino. El resultado es una tercera generación de modelos que están desarrollados en colaboración con la firma de Mountain View.
Tenemos cinco modelos en total: AFM 3 Core : modelo denso de 3B parámetros AFM 3 Core Advanced : modelo disperso de 20B parámetros con activación de 1B a 4B parámetros según la tarea AFM 3 Cloud : un modelo potente pero también eficiente y veloz que corre en la nube de Apple. ADM 3 Cloud (Image) : para la generación y edición de imágenes, el corazón tanto de estas opciones como del nuevo Image Playground AFM 3 Cloud Pro : el modelo en la nube más potente de Apple está destinado agentes autónomos. Se ha entrenado con TPUs de Google y se ejecuta en GPUs de Nvidia dentro de la infraestructura de Google Cloud El rendimiento, una incógnita .

A diferencia de lo que suelen hacer otras empresas cuando presentan sus modelos, Apple no ha publicado métricas sobre benchmarks conocidos. En lugar de eso muestra métricas de "preferencia humana" en las que compara la satisfacción de los usuarios al usar sus modelos frente a otros de la competencia. Las comparaciones son además con versiones previas de estos modelos, lo que no aclara demasiado lo que se puede esperar de ellos. Pero no están en la carrera por el mejor modelo .
En 2025 sí hubo comparación con modelos de pesos abiertos de aquella época (Qwen-3-4B en local, GPT-4o o Llama 4 Scout en la nube) y entonces parecían estar a buen nivel en referencia a esas opciones.
Etiquetas: Apple, IA, ChatGPT, Claude, OpenAI, Anthropic, privacidad, Tecnología · OpenAI, ChatGPT y Anthropic
