(CLO) Meta, die Muttergesellschaft von Facebook, gab am Freitag bekannt, dass sie eine Reihe neuer KI-Modelle auf den Markt bringt, darunter einen „selbstlernenden Evaluator“, der menschliche Eingriffe in den KI-Entwicklungsprozess reduzieren kann.
Die Ankündigung erfolgt, nachdem Meta das Tool im August in einem Forschungspapier vorgestellt und beschrieben hat, wie es eine „Gedankenketten“-Technik ähnlich den neuen Modellen von OpenAI verwendet, um genaue Urteile über die Reaktionen des KI-Modells zu treffen. Diese Technik zerlegt komplexe Probleme in einfachere logische Schritte und trägt so zur Verbesserung der Genauigkeit in Bereichen wie Naturwissenschaften, Programmierung und Mathematik bei.
Meta-KI-Symbol. Foto: Reuters
Die Metaforscher verwendeten zum Trainieren dieses Bewertungsmodells ausschließlich KI-generierte Daten und eliminierten so in dieser Phase vollständig menschliche Eingriffe.
Die Möglichkeit, KI zur Bewertung der KI selbst zu verwenden, birgt laut zwei Meta-Forschern das Potenzial für die Entwicklung autonomer KI-Agenten, die aus ihren eigenen Fehlern lernen können.
Viele Experten auf dem Gebiet der künstlichen Intelligenz stellen sich diese intelligenten digitalen Agenten als digitale Assistenten vor, die in der Lage sind, eine Vielzahl von Aufgaben ohne menschliches Eingreifen auszuführen.
Modelle, die sich selbst verbessern können, könnten den Prozess des „Reinforcement Learning from Human Feedback“ überflüssig machen, der hochqualifizierte Experten erfordert, um Daten zu kennzeichnen und die Genauigkeit komplexer mathematischer und schriftlicher Antworten zu überprüfen. Dieser Prozess ist derzeit sehr kostspielig und ineffizient.
„Wir hoffen, dass die KI mit zunehmender Überlegenheit gegenüber dem Menschen auch besser darin wird, ihre eigene Arbeit zu überprüfen und dabei sogar die menschlichen Fähigkeiten übertrifft“, sagte Jason Weston, einer der Forscher des Projekts.
„Die Fähigkeit zu lernen und sich selbst einzuschätzen ist der Schlüssel zur Entwicklung von KI auf übermenschliches Niveau“, fügte er hinzu.
Neben Meta haben auch andere Unternehmen wie Google und Anthropic Forschungsergebnisse zum Konzept von RLAIF oder „Reinforcement Learning From Feedback in AI“ veröffentlicht. Im Gegensatz zu Meta geben diese Unternehmen ihre Modelle jedoch selten für die öffentliche Nutzung frei.
Cao Phong (laut Reuters)
[Anzeige_2]
Quelle: https://www.congluan.vn/meta-phat-hanh-mo-hinh-ai-co-the-tu-hoc-va-tu-phat-trien-post317675.html
Kommentar (0)