Chinesisches Unternehmen führt KI ein, um gefälschte Videos zu erstellen, die genauso aussehen wie die echten

Báo Dân tríBáo Dân trí07/02/2025

(Dan Tri) – ByteDance, die Muttergesellschaft von TikTok, überraschte alle mit der Vorstellung eines KI-Tools, mit dem Videos mit realistischen Inhalten erstellt werden können.


ByteDance, das Technologieunternehmen hinter dem sozialen Netzwerk TikTok, hat gerade ein neues Modell künstlicher Intelligenz (KI) namens OmniHuman-1 vorgestellt, mit dem lebensechte, animierte Videos erstellt werden können.

Laut ByteDance basiert OmniHuman-1 auf Deepfake-Technologie, die die Erstellung von Videos mit extrem flüssigen Bewegungen ermöglicht und bei der es sehr schwierig ist, zu erkennen, dass es sich um ein Produkt der künstlichen Intelligenz handelt. ByteDance behauptet voller Überzeugung, dass seine KI-Engine im Vergleich zu anderen bestehenden KI-Tools zur Videoerstellung Produkte mit überragender Qualität erstellen kann.

Video des Vortrags von Albert Einstein, erstellt von OmniHuman-1 aus dem Bild des Wissenschaftlers (Video: ByteDance).

Den Forschern von ByteDance zufolge benötigt OmniHuman-1 zur Modellierung nur ein einziges Bild und einen einzigen Ton, etwa die Stimme oder Singstimme einer beliebigen Person. Auf Grundlage dieser Daten kann das KI-Tool Videos beliebiger Länge generieren, mit Stimmen oder Gesang, die mit dem Beispiel-Audio identisch sind.

OmniHuman-1 kann auch vorhandene Videos bearbeiten und ändern, um den Inhalt des Originalvideos zu verändern.

Darüber hinaus können Benutzer mit OmniHuman-1 auch neue Videos in verschiedenen Bild- und Audiostilen erstellen, beispielsweise animierte Videos, Kinostile oder lebensechte Videos.

Auf Benutzeranfrage von OmniHuman-1 erstelltes Video (Video: ByteDance).

Benutzer müssen lediglich Anforderungen hinsichtlich des Seitenverhältnisses und des Körperverhältnisses (Hochformat, Halbkörper, Ganzkörper oder alles in einem) angeben. Dieses KI-Tool kann Videos mit höchster Authentizität erstellen, einschließlich Bewegungen, Beleuchtung, Umgebungsdetails usw.

ByteDance hat OmniHuman-1 noch nicht offiziell der Öffentlichkeit zugänglich gemacht, das Unternehmen hat jedoch mit dem Tool erstellte Beispielvideos veröffentlicht.

Aus einem Bild von Albert Einstein, in dem der berühmte Wissenschaftler einen Vortrag hielt, wurde ein 23-sekündiges Video mit lebensechten Gesichts- und Lippenbewegungen erstellt.

In mehreren anderen von OmniHuman-1 erstellten Kurzvideos werden Personen mit lebensechten Gesten und Gesichtsausdrücken bei Präsentationen gezeigt.

Video von Charakteren, die Präsentationen halten, erstellt von OmniHuman-1 aus Standbildern (Video: ByteDance).

Demonstrationsvideos zu den Fähigkeiten von OmniHuman-1 haben die Online-Community und die Technikwelt in Erstaunen versetzt. Viele Leute geben zu, dass dies das realistischste gefälschte Video ist, das sie je gesehen haben.

Die Forscher von ByteDance sagten, sie hätten ein KI-Modell erstellt, das in der Lage sei, Daten aus Bildern, Videos und Audio zu mischen, um realistische Videos mit möglichst menschenähnlichen Gesichtsproportionen, Körper, Gesichtsausdrücken und Aktionen zu erstellen.

Das Forschungsteam sagte, dass die von KI erstellten Videos natürliche Gesichter, Kopfbewegungen, Gesten usw. aufweisen, die zu den Umgebungsgeräuschen und -szenen passen und so dazu beitragen, den „Realismus“ der Videos zu erhöhen.

ByteDance hat noch nicht bekannt gegeben, wann OmniHuman-1 für Benutzer verfügbar sein wird.

Von OmniHuman-1 aus Bildern erstelltes Video, wobei sich die Szenerie außerhalb des Zugfensters realistisch verändert (Video: ByteDance).

Das Aufkommen von OmniHuman-1 zeigt die unglaublichen Fähigkeiten der aus China kommenden KI-Tools. Viele befürchten jedoch, dass OmniHuman-1 für böswillige Zwecke eingesetzt werden könnte, etwa zum Erstellen gefälschter Promi-Videos, um falsche Informationen zu verbreiten, für Betrug oder sogar zum Erstellen gefälschter Pornovideos zu Erpressungszwecken.

Der Wettlauf um die KI-Entwicklung zwischen den USA und China wird immer intensiver, da diese beiden Supermächte kontinuierlich KI-Tools mit überlegenen Funktionen einführen, um ihre Gegner zu besiegen.

Vor einigen Tagen hat OpenAI außerdem eine neue Funktion in ChatGPT integriert, mit der das Tool in nur wenigen Minuten einen Bericht aus einer riesigen Datenmenge erstellen kann – eine Aufgabe, für die ein Mensch Stunden benötigen würde.

Deepfake ist eine künstliche Intelligenztechnologie, die Bildsynthesetechniken einer Person verwendet, um das Gesichtsbild mit einem Video oder Bild einer anderen Person zu kombinieren und überzulagern.

Deepfake durchläuft einen „Lernprozess“, bei dem auf der Grundlage von Eingabedaten Modelle erstellt und geeignete Algorithmen ausgewählt werden, um diese Modelle kontinuierlich zu verarbeiten und daraus zu lernen. Nach einer „Lernphase“ war Deepfake in der Lage, Gesichter mit hoher Präzision zusammenzuführen, die mit bloßem Auge nur schwer zu erkennen waren.


[Anzeige_2]
Quelle: https://dantri.com.vn/suc-manh-so/cong-ty-trung-quoc-ra-mat-ai-tao-video-gia-mao-giong-het-nhu-that-20250206125927906.htm

Kommentar (0)

No data
No data

Event Calendar

Cùng chủ đề

Cùng chuyên mục

Cùng tác giả

No videos available