Google DeepMind lanza DiffusionGemma, un modelo que ejecuta el AI local 4 veces más rápido

Google DeepMind ha lanzado un nuevo modelo de inteligencia artificial llamado DiffusionGemma, que forma parte de la familia de modelos abiertos Gemma 4. A diferencia de otros modelos de IA, DiffusionGemma no genera texto de manera lineal, sino que puede producir un bloque completo de texto en paralelo. Esto se logra mediante un proceso de difusión, similar al utilizado en la generación de imágenes, donde se parte de un campo de tokens de marcador y se refina iterativamente hasta obtener el texto deseado.

Este enfoque permite que DiffusionGemma sea más rápido y eficiente al ejecutarse en hardware local, como una tarjeta gráfica Nvidia. En pruebas, el modelo ha demostrado ser capaz de generar alrededor de 700 tokens por segundo con una tarjeta gráfica RTX 5090, y más de 1.000 tokens por segundo con un acelerador de IA Nvidia H100. Esto representa un aumento de velocidad de aproximadamente cuatro veces en comparación con modelos autoregresivos similares.

La importancia de esta noticia radica en que la velocidad y eficiencia de los modelos de IA son fundamentales para su adopción en una variedad de aplicaciones, desde el procesamiento de lenguaje natural hasta la generación de contenido. La capacidad de ejecutar modelos de IA de manera local y eficiente puede abrir nuevas posibilidades para desarrolladores y empresas que buscan aprovechar el potencial de la inteligencia artificial. Además, la investigación en este campo puede tener un impacto significativo en la forma en que se desarrollan y se utilizan los modelos de IA en el futuro.

Leer artículo original en Ars Technica AI

Este resumen es una síntesis informativa elaborada por dataqbs.com. Todos los derechos sobre el contenido original pertenecen a su autor y al medio de comunicación citado. Nosotros solo actuamos como curadores de noticias tecnológicas, sin reclamar autoría alguna.