Artificial Joey diggs Pizza with Cheese

joey1

Neues Paper von James Charles, Derek Magee und David Hogg von der Uni Leeds mit dem eher prätentiösen Titel Virtual Immortality (PDF). Die kopieren letztlich „nur“ Audiobruchstücke aus vorhandenen Aufnahmen zu neuen Dialogzeilen zusammen und kleben einen künstlich generierten Mund auf bereits gefilmtes Material.

Das Ergebnis ist extrem holprig, die Methode nicht sehr elegant (finde ich) und hat mit „Virtual Immortality“ noch nicht viel zu tun. Aber die Arbeit weisst natürlich durchaus in die Richtung von unabhängig vom „lebenden Subjekt“ agierenden künstlichen Avataren. Dauert aber noch, offensichtlich. (Wobei ich da eher auf Arbeiten wie Tom Whites Facegrids setzen würde, der jede Menge Gesichter komplett generiert und auch animiert.)

The objective of this work is to build virtual talking avatars of characters fully automatically from TV shows. From this unconstrained data, we show how to capture a character’s style of speech, visual appearance and language in an effort to construct an interactive avatar of the person and effectively immortalize them in a computational model. We make three contributions (i) a complete framework for producing a generative model of the audiovisual and language of characters from TV shows; (ii) a novel method for aligning transcripts to video using the audio; and (iii) a fast audio segmentation system for silencing nonspoken audio from TV shows. Our framework is demonstrated using all 236 episodes from the TV series Friends (≈ 97hrs of video) and shown to generate novel sentences as well as character specific speech and video.