Synthesizing Obama: Learning Lip Sync from Audio

Supasorn Suwajanakorn (TH), Steven Seitz (US), Ira Kemelmacher-Shlizerman (IL)

Ein Tondokument von Barack Obama wird in ein Video übertragen. Dank exakter Lippensynchronisation entsteht der Eindruck, Obama sei direkt gefilmt worden.

Die WissenschaftlerInnen trainierten ein rückgekoppeltes neuronales Netzwerk viele Stunden lang mit den wöchentlichen Ansprachen Obamas, von Audiodaten bis hin zu den Mundbewegungen. Seine Mundform wird dabei immer wieder synthetisiert, also künstlich nachgestellt und durch 3D Daten an die aktuelle Situation angepasst: Dadurch sind die Tonspur und das Video perfekt aufeinander abgestimmt und erzeugen beeindruckende fotorealistische Ergebnisse entstehen.

Credits

GRAIL Lab @ University of Washington

Tags:

Synthesizing Obama: Learning Lip Sync from Audio

Supasorn Suwajanakorn (TH), Steven Seitz (US), Ira Kemelmacher-Shlizerman (IL)

Credits

Tags:

Folgen Sie uns!