Google presentó el 19 de mayo de 2026 durante el Google I/O a Gemini Omni, el nuevo sistema de inteligencia artificial de DeepMind que procesa y genera texto, imagen, audio y video en una sola arquitectura bajo el concepto de “Modelo del Mundo”. La compañía promete que el usuario podrá crear piezas audiovisuales completas a partir de instrucciones conversacionales sin cambiar de plataforma.
La función central es la edición conversacional de video: se describen los cambios con lenguaje natural y el sistema modifica escenas, aplica estilos referencia, reutiliza fotografías o clips previos y entrega un render de alta calidad. El objetivo es eliminar la fragmentación entre herramientas de edición externas.

Desde el mismo día de su anuncio, Google habilitó Gemini Omni Flash para mayores de 18 años con suscripciones Google AI Plus, Pro y Ultra. El acceso se da a través de la app Gemini, Google Flow y Shorts; no hay versión gratuita ni prueba abierta al público general.

La empresa no precisa cuándo llegará el modelo completo ni cuándo se liberará la API para desarrolladores y empresas. Solo adelanta que “parte de sus funciones” se incorporará de forma progresiva a Shorts, lo que podría ampliar el alcance a usuarios sin pago mensual.

El lanzamiento se produce mientras OpenAI, ChatGPT y Anthropic mantienen sus propias agendas de modelos multimodales, por lo que el sector espera comparaciones de desempeño y costo una vez que Gemini Omni esté disponible fuera del cerco de pago.
Etiquetas: Tecnología, Gemini Omni, Google, Inteligencia Artificial, México, Tecnología · OpenAI, ChatGPT y Anthropic, Tecnología · OpenAI, ChatGPT y Anthropic
