Google AI learns important Stuff

Gepostet vor 3 Monaten in Tech Share: Twitter Facebook Mail

bask

Neues Paper von Google AI, deren Bilderkennung jetzt zwischen wichtigen und unwichtigen Inhalten in Videos unterscheiden kann. Vor zwei Monaten reichte es noch „nur“ für auflistende Bildbeschreibungen, jetzt weiß das Teil dank einer „Aufmerksamkeitsmaske“, welche Gegenstände oder Akteure am bedeutendsten sind. Der Algorithmus benötigt allerdings eine Videoquelle, um die Wichtigkeit aus einer Timeline zu berechnen, mit Fotos funktioniert das (noch) nicht. Natürlich ideal für die Überwachung von öffentlichen Plätzen und sowas. PDF: Detecting events and key actors in multi-person videos.

Multi-person event recognition is a challenging task, often with many people active in the scene but only a small subset contributing to an actual event. In this paper, we propose a model which learns to detect events in such videos while automatically “attending” to the people responsible for the event. Our model does not use explicit annotations regarding who or where those people are during training and testing. In particular, we track people in videos and use a recurrent neural network (RNN) to represent the track features. We learn time-varying attention weights to combine these features at each time-instant. The attended features are then processed using another RNN for event detection/classification.

Since most video datasets with multiple people are restricted to a small number of videos, we also collected a new basketball dataset comprising 257 basketball games with 14K event annotations corresponding to 11 event classes. Our model outperforms state-of-the-art methods for both event classification and detection on this new dataset. Additionally, we show that the attention mechanism is able to consistently localize the relevant players.

Tags: AI AlgoCulture

face

Neural Network Facemorphs

Hübsche Spielerei mit AI-Gesichtern von Michael Flynn: Generating Faces with Deconvolution Networks. Letztlich „nur“ eine animierte Version von den bekannten…

stfu

Conversation AI: Googles algorithmischer Troll-Filter triggert 4chan

Nachdem Yahoo vor ein paar Wochen seinen Anti-Troll-Algorithmus vorgestellt hatte, schreibt Wired nun über Googles Jigsaw-Abteilung, die an einem AI-Tool…

floete

Ausgerechnete Drachen-Flöten aus dem 3D-Drucker

I want my Octopus-Flute NAO! „This paper presents an interactive design interface for three-dimensional free-form musical wind instruments.“ The sound…

nne

Neural Network Bild-Retusche

Andrew Brock hat einen Foto-Editor mit AI-Retusche programmiert, hier auf Github, da das Paper. Alles noch im experimentellen Stadium, wie…

beatles

AI-composed „Beatles-Song“

Sony hat seine künstliche Intelligenz auf verschiedene Komponisten trainiert und die spuckt jetzt Song-Bausteine im Stil von [you name it]…

enhance

Neural Network Super Resolution getting good, fast

Neulich bloggte ich über die K.I.-Version der Zoom & Enhance-Meme und meinte noch, das seien ja nur 64x64 Pixel und…

netw

Neural Network Compositing

Adobe Research und die Uni Berkley arbeiten an Retusche und Compositing via Machine Learning. Die Ergebnisse sind zwar beeindruckend, aber…

sam

Google WaveNet: Neural Network-generated Text-2-Speech

Google hat seine Neural Networks auf Stimmerzeugung trainiert und ein neues Verfahren zur Synthetisierung von Sprache erfunden. Die Ergebnisse sind…

algobaby

Algo-Video-Babys are absolutely not creepy, not creepy at all

Total interessantes Paper vom MIT: Generating Videos with Scene Dynamics (via Gene Kogan). Die haben Neural Networks auf Videos trainiert…

poppy

Neural Network Poppy 🙃

Poppy inside the Machine 🙃 🙂 🙃 🙂 🙃 🙂 🙃 🙂 🙃 🙂 🙃 🙂 🙃 🙂 🙃 🙂…

enhance1

Zoom & Enhance via Neural Network Super Resolution

Zoom and Enhance in der AI-Variante, ein Neural Network gleicht den Informationsverlust durch Zooming aus. Das Ergebnis ist so mittel,…