Google DeepMind veröffentlicht DiffusionGemma, ein Modell das lokale AI 4x schneller ausführt.

Google DeepMind hat einen neuen KI-Modell namens DiffusionGemma vorgestellt, der Teil der offenen Modell-Familie Gemma 4 ist. Im Gegensatz zu anderen KI-Modellen generiert DiffusionGemma keinen Text linear, sondern kann einen vollständigen Textblock parallel produzieren. Dies wird durch einen Diffusionsprozess erreicht, ähnlich dem, der bei der Bildgenerierung verwendet wird, wobei von einem Token-Marker-Feld aus iterativ gefiltert wird, bis der gewünschte Text erhalten ist.

Diese Herangehensweise ermöglicht es DiffusionGemma, schneller und effizienter auf lokalem Hardware zu laufen, wie einer Nvidia-Graphikkarte. In Tests konnte das Modell etwa 700 Token pro Sekunde mit einer Nvidia-RTX-5090-Graphikkarte und über 1.000 Token pro Sekunde mit einem Nvidia-H100-IA-Accelerator erzeugen. Dies entspricht etwa viermal so hoher Geschwindigkeit wie bei ähnlichen autoregressiven Modellen.

Die Bedeutung dieser Nachricht liegt darin, dass die Geschwindigkeit und Effizienz von KI-Modellen für ihre Einführung in einer Vielzahl von Anwendungen, von der natürlichen Sprachverarbeitung bis zur Inhaltsgenerierung, von entscheidender Bedeutung ist. Die Fähigkeit, KI-Modelle lokal und effizient auszuführen, kann neue Möglichkeiten für Entwickler und Unternehmen eröffnen, die das Potenzial der künstlichen Intelligenz nutzen möchten. Darüber hinaus kann die Forschung in diesem Bereich einen erheblichen Einfluss auf die Entwicklung und Verwendung von KI-Modellen in der Zukunft haben.

Originalartikel lesen auf Ars Technica AI

Diese Zusammenfassung ist eine informationelle Synthese von dataqbs.com. Alle Rechte am Originalinhalt liegen beim Autor und dem genannten Medienunternehmen. Wir handeln ausschließlich als Kuratoren von Technologie-Nachrichten und beanspruchen keine Urheberschaft.