4 AI-Obamas learn Algo-Lipsynch from Audio

Gepostet vor 3 Monaten, 16 Tagen in #Design #Tech #AI #AlgoCulture #Audio #CGI #Fake #FakeNews #Photoshop

Share: Twitter Facebook Mail

Seit ich über die neuen Möglichkeiten von Machine Learning bezüglich Computer Vision und der Generation von Bildern schreibe, vor allem bei Projekten wie Face2Face oder dem Adobe Voice-Generator, schreibe ich in kurzen, halbironischen Sätzen oft dazu, dass wir uns bald von unserer Realität verabschieden können und das FakeNews-Problem von 2016 nur den Auftakt darstellte.

Gestern postete die SigGraph Konferenz ihr 2017er Paper-Video. Darin stellen sie die neuesten Entwicklungen im Bereich des CGI (Computer-Generated Imagery) dar. Ich poste diese Videos regelmäßig, it's my thing. Im neuen Clip stellen sie jede Menge neuer Technologien vor, und eine davon lies mir grade die Kinnlade auf den Schreibtisch knallen.

Ab Minute 1:25 stellen sie das Paper „Synthesizing Obama: Learning Lip synch from Audio“ (noch nicht online, wenn das auftaucht, mach ich nochmal was dazu).

Die haben aus Sprach-Audiofiles (!) vier verschiedene Obama-Videos generiert, die exakt zu den gesprochenen Worten gesyncht sind. Die Videoqualität ist mindblowing (ich habe das alte Face2Face-Video unten nochmal dazu gepackt zum Vergleich) und nicht mehr weit vom Fotorealismus (müsste man sich näher anschauen) entfernt. Die Bewegungen sind flüssig und vor allem: Sie sehen denen von Obama zum verwechseln ähnlich. Vergleicht die Qualität von 2017 mit dem vom März 2016 (Video unten). Da liegen ganze Realitäten dazwischen.

Das heisst, in nur wenigen Monaten werden wir die Möglichkeit haben, mit Adobe Audio eine Aufnahme von Trumps Kriegserklärung an Nordkorea zu generieren und per AI in ein täuschend echtes Video zu verwandeln.

Ich kann mich nur wiederholen: Fuck FakeNews. We ain't seen nothing yet.

Algorithmic Image-Watermark Remover

Google hat ein neues Paper über die automatische Entfernung von Wasserzeichen in Pics, netterweise nennen sie das Paper „On the…

10 PRINT CHR$ (205.5 + RND (1)); on a Commodore Pet

10 PRINT CHR$ (205.5 + RND (1)); 20 GOTO 10 ist sowas wie ein Miniatur-Programm in Basic für Generative Graphics,…

DeepMind releases StarCraft AI

Google und Blizzard haben ihre StarCraft AI veröffentlicht: Testing our agents in games that are not specifically designed for AI…

Self-Driving Cars hacked with Love and Hate

Wissenschaftler der Uni Washington haben die Computer-Vision-Systeme von selbstfahrenden Autos gehackt – indem sie Love und Hate in colorierten Pixelfonts auf…

Podcasts: Dystopien und Utopien (mit yours truly), die Philosophie der Lüge und Grenzbereiche des Bipolaren

Vor einer Woche war ich zu Gast in einer Breitband-Sendung über Science-Fiction, Dystopien und Utopien: Breitband: Die Erfindung der Zukunft…

The Bullshit Lectures

Vor ein paar Monaten bloggte ich über die Ankündigung der Uni Washington des ersten Seminars über Bullshit. Ich hatte das…

Cellular Automata Cube

Cubes.io: Conways Game of Life als 3D-Spielzeug mit Cubes und Spheres und Schnickschnack als Evolution-Nullpunkt, von wo aus die ganzen…

Neural Network-Faces synched to Music

„My first attempt to map a song made by @kamptweets onto GAN generated proto-faces.“ Bohemian Rhapsody next. The Three Nightingans.…

Doku: Im Netz der Lügen - Falschmeldungen im Internet

Nette Doku von Mario Sixtus über die Psychologie der Fake News. Der Einstieg der Doku ist mir ein wenig zu…

Die AFD auf dem Mond

Mein Buddy Gregor Weichbrodt hat „Personen und Objekte der 'Alternative für Deutschland' in die Schwarzweißfotografien der Apollo-Mondmissionen“ geshoppt und die…

AI-Animations with human Sounds

Google vor ein paar Tagen so: „Yay, wir haben hier 'ne neue AI-based Animation-Tech, hooray!“ (Paper) Hayayo Miyazaki über AI-based…