Visual Microphone: Audio extracted from Vibrations of a Potato-Chip Bag

Gepostet vor 2 Jahren, 9 Monaten in #Misc #Tech #Audio

Share: Twitter Facebook Mail

Wissenschaftler am MIT haben Audiodaten aus Videos einer Chipspackung extrahiert, die von eben genau diesen Audiosignalen vibrierte. Die haben das nicht nur mit Highspeed-Kameras geschafft, sondern auch mit handelsüblichen 60FPS-Cams. Die Implikationen kann sich jeder selber ausrechnen.

Researchers at MIT, Microsoft, and Adobe have developed an algorithm that can reconstruct an audio signal by analyzing minute vibrations of objects depicted in video. In one set of experiments, they were able to recover intelligible speech from the vibrations of a potato-chip bag photographed from 15 feet away through soundproof glass.

In other experiments, they extracted useful audio signals from videos of aluminum foil, the surface of a glass of water, and even the leaves of a potted plant. The researchers will present their findings in a paper at this year’s Siggraph, the premier computer graphics conference.

MIT: Extracting audio from visual information, The Visual Microphone: Passive Recovery of Sound from Video (via MeFi)

4 AI-Obamas learn Algo-Lipsynch from Audio

Seit ich über die neuen Möglichkeiten von Machine Learning bezüglich Computer Vision und der Generation von Bildern schreibe, vor allem…

AI Voice-Cloning

Vor ein paar Monate veröffentlichte Google sein WaveNet, ein auf Stimmen trainiertes Neurales Netzwerk mit einem deutlichen Qualitätssprung gegenüber bisherigen…

Artificial Demon Voice controls your Phone

Wissenschaftler haben eine Methode entwickelt, um Voice Commands in Sounds zu verstecken, die sich für das menschliche Ohr wie extrem…

Impulse: Electronic Tonalities in Cinema

Superinteressantes Video-Essay von Brian Cantrell über elektronische Klänge in der Geschichte des (vor allem SciFi-)Kinos. Nur einer von vielen Essays…

Podcasts: Sonic Armageddon Black Noise, Imagined Communities, die zehn Verwandlungen des David Bowie und was sind Eliten?

Haufenweise Podcasts, die ich in den letzten Wochen gehört habe. Da ist eine Menge interessanter Kram dabei, nochmal mit Abstand…

Style-Transfer für Audio

Dmitry Ulyanov und Vadim Lebedev mit einem ersten Ansatz für Style Transfer für Audio oder anders formuliert: Neural Network machen…

Adobe Voice-Generator formuliert neue Worte aus Stimmaufnahmen

Adobe hat vor zwei Tagen auf seiner Max Conference neben AI-Schnickschnack für seine CreativeCloud auch ein neues Tool namens VoCo…

Audio-Filters applied to 3D-Objects

Beautiful Glitches by GenerateMe: „This is what happens when you apply sonification process to 3d .obj vertex data.“

Ötzi-Rülps

Wissenschaftler haben die Stimmbänder von Ötzi rekonstruiert und nun rülpst der Iceman nach 5300 Jahren auf Youtube Vokale vor sich…

Audio from Typo-Outlines

Gestern auf der Konferenz der Association Typographique Internationale in der Academy of Fine Arts in Warsaw: Type-Designer Just van Rossum…

Bank Datacenter downed by Noise

In Rumänien sind die Festplatten im Data-Center einer Bank gecrasht, weil der Krach während einer Feuerübung, bei der sie Gas…