Automatic Audio-Supercuts with Python

Gepostet vor 1 Jahr, 10 Monaten in #Misc #Tech #Audio #Audiobooks #Coding #Language #Supercut

Share: Twitter Facebook Mail

Sam Lavigne hat sein Videogrep-Script aufgebohrt: „Audiogrep is a python script that transcribes audio files and then creates audio 'supercuts' based on search phrases. It uses CMU Pocketsphinx for speech-to-text, and pydub to splice audio segments together.“

Hier zum Beispiel alle Ansagen zu „Private Wealth“ in der Audiobook-Version von Thomas Pikettys Capital in the Twenty-first Century:

peck

Punch it Baby!

Cool Sam Peckinpah-Tribute by Alex Kalogeropoulos: |CINEMASTERS| is a series that focuses on film's most prominent and influential auteurs, past…

impulse

Impulse: Electronic Tonalities in Cinema

Superinteressantes Video-Essay von Brian Cantrell über elektronische Klänge in der Geschichte des (vor allem SciFi-)Kinos. Nur einer von vielen Essays…

noise

Podcasts: Sonic Armageddon Black Noise, Imagined Communities, die zehn Verwandlungen des David Bowie und was sind Eliten?

Haufenweise Podcasts, die ich in den letzten Wochen gehört habe. Da ist eine Menge interessanter Kram dabei, nochmal mit Abstand…

captcha

Miniature-Playground for Captcha-Solving AIs

„I'm not a Robot“ my ass. Mini World of Bits ('MiniWoB') is a benchmark for reinforcement learning agents who interact…

panic

How To build a Marvin the Depressed Reddit Bot in Python

Die Grünen fordern ja eine Transparenzpflicht für Social Bots. Ich hoffe inständig, dass jemand einen angemessenen Marvin-Bot für die Grünen…

nnnames

Neural Network Names from the Future

Nate Parrott hat ein Neural Network auf 7500 Vornamen trainiert und generiert nun neue Namen aus der Zukunft, inklusive „…

press_03-768x862

Podcasts: Das Kapital, Netzpolitik, politische Utopien und das Ende der Massenmedien

Breitband: „Off the record – die Mauer des Schweigens“ (MP3, Info): Die Autorin, Regisseurin und Schauspielerin Christiane Mudra beschäftigt sich…

trump

Donald Trumps Name in Gebärdensprache

Donald Trump in Gebärdensprache, oben der Vorschlag für die American Sign Language als GIF, unten der für Österreichs Gebärdensprache. Now…

Style-Transfer für Audio

Dmitry Ulyanov und Vadim Lebedev mit einem ersten Ansatz für Style Transfer für Audio oder anders formuliert: Neural Network machen…

ram_01

Mechanical Sand-RAM

Schöne Arbeit von Ralf Baecker, ein mechanischer RAM, der Binärdaten mit Sandkörnern schreibt und damit ein bisschen Voodoo ausrechnet: Random…

456170_10151334428835368_2009538313_o

VERßALßATZ-ẞ WIRD OFFIßIELL

Der Rat für Rechtschreibung hat in seinem Bericht an die Ständige Konferenz der Kultusminister vorgeschlagen, das große scharfe S offiziell…