Gemma 3 wird in 4 Varianten veröffentlicht, darunter 1 Milliarde, 4 Milliarden, 12 Milliarden und 27 Milliarden Parameter. Laut Google handelt es sich hierbei um das weltweit beste Single-Speed-Modell, das auf einer einzigen GPU oder TPU ausgeführt werden kann, ohne dass ein großer Computercluster erforderlich wäre.

Theoretisch kann Gemma 3 dadurch direkt auf der Tensor Processing Unit (TPU) des Pixel-Telefons ausgeführt werden, ähnlich wie das Gemini Nano-Modell lokal auf einem Mobilgerät ausgeführt wird.

Im Vergleich zur Gemini AI-Modellreihe ist der größte Vorteil von Gemma 3 sein Open-Source-Charakter, der es Entwicklern erleichtert, es bei Bedarf anzupassen, zu verpacken und in mobilen Anwendungen und Desktop-Software bereitzustellen. Darüber hinaus unterstützt Gemma über 140 Sprachen, von denen 35 bereits als Trainingspakete verfügbar sind.

ad13e24ffc15c60fc50aa51c6fff5038.jpeg
Vergleich der Leistung von Gemma 3 (Version mit 27 Milliarden Parametern) mit anderen KI-Modellen. Foto: Google

Ähnlich wie die neuesten Gemini 2.0-Modelle kann Gemma 3 Text, Bilder und Videos verarbeiten. In Bezug auf die Leistung übertrifft Gemma 3 viele andere beliebte Open-Source-KI-Modelle, darunter DeepSeek V3, OpenAI o3-mini und die Llama-405B-Variante von Meta.

Kontext entspricht 200 Buchseiten

Gemma 3 unterstützt Kontextfenster mit bis zu 128.000 Token, was der Datenmenge eines 200-seitigen Buches entspricht. Zum Vergleich: Das Gemini 2.0 Flash Lite-Modell verfügt über ein Kontextfenster von bis zu 1 Million Token.

79f4765176ea9c0652ae7c685e0c1e21.jpeg
Vergleich der Leistung von Gemma 3 (Version mit 27 Milliarden Parametern) mit anderen KI-Modellen. Foto: Google

Gemma 3 kann mit externen Datensätzen interagieren und als automatisierter Agent fungieren, ähnlich wie Gemini nahtlos die Arbeit über Plattformen wie Gmail oder Docs hinweg unterstützt.

Die neuesten Open-Source-KI-Modelle von Google können lokal oder über die Cloud-Dienste des Unternehmens, beispielsweise Vertex AI, bereitgestellt werden. Gemma 3 ist jetzt auf Google AI Studio sowie auf Plattformen von Drittanbietern wie Hugging Face, Ollama und Kaggle verfügbar.

Das Open-Source-Modell der dritten Generation von Google ist Teil eines Branchentrends, bei dem Unternehmen sowohl große Sprachmodelle (LLMs) als auch kleine Sprachmodelle (SLMs) parallel entwickeln. Auch Googles Konkurrent Microsoft verfolgt mit seiner Open-Source-Familie kleiner Sprachmodelle Phi eine ähnliche Strategie.

Kleine Sprachmodelle wie Gemma und Phi werden für ihre Ressourceneffizienz hoch geschätzt, was sie ideal für die Ausführung auf Geräten wie Smartphones macht. Darüber hinaus eignen sie sich aufgrund der geringeren Latenz besonders für mobile Anwendungen.

US-Justizministerium: Google muss sich für immer vom Chrome-Browser „verabschieden“ Der Suchmaschinenriese Google wird gezwungen sein, den Chrome-Browser zu verkaufen, darf aber weiterhin in Startups im Bereich künstliche Intelligenz investieren.