Facebook-Gründer veröffentlicht neues KI-Modell

Die Muttergesellschaft von Facebook hat gerade zwei neue Modelle der Llama 4-Kollektion angekündigt. Dies ist dasselbe Modell, das für den Meta-KI-Assistenten im Web sowie in WhatsApp, Messenger und Instagram verwendet wird und Menschen dabei hilft, personalisiertere Multimedia-Erlebnisse zu schaffen.

Die beiden neuen Modelle, die jetzt von Meta oder Hugging Face zum Download bereitstehen, sind das Llama 4 Scout und das Llama 4 Maverick. Meta sagt, dass es sich noch immer im Trainingsprozess für Llama 4 Behemoth befindet, ein riesiges Modell, das laut CEO Mark Zuckerberg „das leistungsstärkste Plattformmodell der Welt“ ist.

Laut Meta verfügt Llama 4 Scout über ein Kontextfenster von bis zu 10 Millionen Token, um ein Vielfaches mehr als das Modell mit der derzeit höchsten Token-Anzahl, Gemini. Diese Zahl stellt den Arbeitsspeicher eines KI-Modells dar.

Meta beschreibt das Modell als leistungsfähiger als Gemma 3 und Gemini 2.0 Flash-Lite von Google sowie als Mistral 3.1 „bei vielen gängigen, öffentlich verfügbaren Benchmarks“, während es dennoch „auf einer einzelnen Nvidia H100-GPU ausgeführt werden kann“.

Für Llama 4 Maverick macht das Unternehmen ähnliche Angaben zur Leistung im Vergleich zu GPT-4o von OpenAI und Gemini 2.0 Flash von Google. Die Programmier- und Inferenzaufgaben von Maverick sind mit denen von DeepSeek-V3 vergleichbar, obwohl weniger als die Hälfte der Parameter verwendet werden.

Figuren der neuen Modelle der Llama 4-Kollektion. Foto: Meta.

Mittlerweile verfügt Behemoth über 288 Milliarden aktive Parameter von insgesamt 2.000 Milliarden Parametern. Obwohl Behemoth noch nicht veröffentlicht ist, sagt Meta, dass es in der Lage ist, seine Konkurrenten (insbesondere GPT-4.5 und Claude Sonnet 3.7) „in einer Reihe von Metriken im MINT-Bereich“ zu übertreffen.

Meta sagt, dass es auf eine „Mix of Experts“-Architektur (MoE) umgestiegen ist, dieselbe Architektur, die DeepSeek zum Erfolg verholfen hat. Die Methode spart Ressourcen, indem nur die Teile des Modells aktiviert werden, die für die jeweilige Aufgabe benötigt werden. Weitere Einzelheiten zu den Produktplänen werden auf der LlamaCon-Konferenz am 29. April bekannt gegeben.

Trotz Kritik an Lizenzbeschränkungen bezeichnet Meta Llama 4 wie die Vorgängermodelle als „Open Source“. Beispielsweise verlangt die Llama 4-Lizenz von kommerziellen Organisationen mit mehr als 700 Millionen aktiven Benutzern pro Monat, vor der Verwendung des Modells die Erlaubnis von Meta einzuholen.

Laut der Open Source Initiative im Jahr 2023 macht eine solche Regelung das Modell „nicht mehr Open Source“.

Quelle: https://znews.vn/cha-de-facebook-ra-mo-hinh-ai-moi-post1543744.html