Adobe Voice-Generator formuliert neue Worte aus Stimmaufnahmen

Gepostet vor 2 Monaten, 18 Tagen in #Science #Tech #Adobe #AI #Audio #Software

Share: Twitter Facebook Mail

obama

Adobe hat vor zwei Tagen auf seiner Max Conference neben AI-Schnickschnack für seine CreativeCloud auch ein neues Tool namens VoCo für Audio-Editing vorgestellt, das Stimmen aus Audio-Aufnahmen generiert und damit täuschend echte Fake-Mitschnitte generieren kann: „VoCo allows you to change words in a voiceover simply by typing new words.“ Praktisch ein Photoshop für Audio. Es wird also in Zukunft nochmal eine ganze Spur leichter, Aussagen von Politikern und Newsschnippsel zu fälschen. Wird eher post-geil dann, auch wenn Adobe laut NZZ an Audio-Wasserzeichen arbeitet, um Fakes zu identifizieren.

Erinnert sehr an Google WaveNet oder Wowtune, nur in einem sehr viel weit fortgeschrittenerem und ready-for-market Stadium.

vocoProject VoCo is designed to be a state-of-the-art audio editing application. Beyond your standard speech editing and noise-cancellation features, Project VoCo can also apparently generate new words using a speaker’s recorded voice. Essentially, the software can understand the makeup of a person’s voice and replicate it, so long as there’s about 20 minutes of recorded speech. In Jin’s demo, the developer showcased how Project VoCo let him add a word to a sentence in a near-perfect replication of the speaker, according to Creative Bloq.

"When recording voiceovers, dialog, and narration, people would often like to change or insert a word or a few words due to either a mistake they made or simply because they would like to change part of the narrative," reads an official Adobe statement. "We have developed a technology called Project VoCo in which you can simply type in the word or words that you would like to change or insert into the voiceover. The algorithm does the rest and makes it sound like the original speaker said those words."

Außerdem und nicht ganz so dramatisch für die Realität: Die bauen Style Transfer und das hier bereits vorgestellte Stylit in ihre CreativeCloud:

Mehr Clips, Vorträge und Keynotes von ihrer Max Conference in den Youtubes von Adobe.

wolf

Algorithm watching Wolf of Wallstreet

Tolles Computervision-Experiment von Støj: An algorithm watching a movie trailer: „A program removing everything but the objects it recognises when…

C2OE_6lXgAEw1Ty

Neural Enhance with creepy artificial Artifacts

Mario Klingemann (Vorher auf NC: Video-Frames sorted by Audio, Typographic Gears) hat einen Algorithmus für künstliche Artefakte gebastelt, die die…

impulse

Impulse: Electronic Tonalities in Cinema

Superinteressantes Video-Essay von Brian Cantrell über elektronische Klänge in der Geschichte des (vor allem SciFi-)Kinos. Nur einer von vielen Essays…

noise

Podcasts: Sonic Armageddon Black Noise, Imagined Communities, die zehn Verwandlungen des David Bowie und was sind Eliten?

Haufenweise Podcasts, die ich in den letzten Wochen gehört habe. Da ist eine Menge interessanter Kram dabei, nochmal mit Abstand…

captcha

Miniature-Playground for Captcha-Solving AIs

„I'm not a Robot“ my ass. Mini World of Bits ('MiniWoB') is a benchmark for reinforcement learning agents who interact…

nnnames

Neural Network Names from the Future

Nate Parrott hat ein Neural Network auf 7500 Vornamen trainiert und generiert nun neue Namen aus der Zukunft, inklusive „…

b00a

Text 2 Bird

Neural Networks generieren Vögel aus Textbeschreibungen in 256x256 Pixeln (das nennen AI-Forscher „High Res“, haha). Die Methode sah qualitätsmäßig vor…

Style-Transfer für Audio

Dmitry Ulyanov und Vadim Lebedev mit einem ersten Ansatz für Style Transfer für Audio oder anders formuliert: Neural Network machen…

fly

Fly AI

Installation von David Bowen, in der eine Künstliche Intelligenz/ein Machine Learning-Algorithmus über das Schicksal einer Fliegenkolonie entscheidet. Brundle-Fly is not…

Amazon works on killing billions of Jobs because Duh.

Amazon works on killing billions of Jobs because Duh.

Welcome to Amazon Go der Zukunft von alleine hierzulande über einer Million Jobs im Einzelhandel, ersetzt durch automatisierte Distribution, Konsum-Überwachung…

algo1

Algorithmic Nicolas Cage/Taylor Swift Face-Swaps

Iryna Korshunova, Wenzhe Shi, Joni Dambre und Lucas Theis haben einen Algorithmus für FaceSwaps programmiert und zur Illustration ihrer Methode…