Google AI learns important Stuff

Gepostet vor 5 Monaten, 5 Tagen in Tech Share: Twitter Facebook Mail

bask

Neues Paper von Google AI, deren Bilderkennung jetzt zwischen wichtigen und unwichtigen Inhalten in Videos unterscheiden kann. Vor zwei Monaten reichte es noch „nur“ für auflistende Bildbeschreibungen, jetzt weiß das Teil dank einer „Aufmerksamkeitsmaske“, welche Gegenstände oder Akteure am bedeutendsten sind. Der Algorithmus benötigt allerdings eine Videoquelle, um die Wichtigkeit aus einer Timeline zu berechnen, mit Fotos funktioniert das (noch) nicht. Natürlich ideal für die Überwachung von öffentlichen Plätzen und sowas. PDF: Detecting events and key actors in multi-person videos.

Multi-person event recognition is a challenging task, often with many people active in the scene but only a small subset contributing to an actual event. In this paper, we propose a model which learns to detect events in such videos while automatically “attending” to the people responsible for the event. Our model does not use explicit annotations regarding who or where those people are during training and testing. In particular, we track people in videos and use a recurrent neural network (RNN) to represent the track features. We learn time-varying attention weights to combine these features at each time-instant. The attended features are then processed using another RNN for event detection/classification.

Since most video datasets with multiple people are restricted to a small number of videos, we also collected a new basketball dataset comprising 257 basketball games with 14K event annotations corresponding to 11 event classes. Our model outperforms state-of-the-art methods for both event classification and detection on this new dataset. Additionally, we show that the attention mechanism is able to consistently localize the relevant players.

Tags: AI AlgoCulture

algo1

Algorithmic Nicolas Cage/Taylor Swift Face-Swaps

Iryna Korshunova, Wenzhe Shi, Joni Dambre und Lucas Theis haben einen Algorithmus für FaceSwaps programmiert und zur Illustration ihrer Methode…

c1

█ Blackout █ Generative Censorship-Poetry

█ Blackout █ ist Liza Dalys Beitrag zum NaNoGenMo 2016 (National Novel Generation Month, das AlgoPoetry-Äquivalent zum NaNoWriMo), ein Algorithmus…

sat

Neural Network Satellite-Images from Doodles

Invisible Cities, ein Neural Network, das Satellitenbilder aus Gekritzel generiert. Funktioniert so ein bisschen wie Style-Transfer, nur für Satellitenpics. In…

birdsounds

Google A.I. sortiert Vogelgesang

Google hat unter AI-Experiments ’ne Spielwiese für Machine Learning und AI eingerichtet. Ein paar der Experimente kannte ich bereits von…

obama

Adobe Voice-Generator formuliert neue Worte aus Stimmaufnahmen

Adobe hat vor zwei Tagen auf seiner Max Conference neben AI-Schnickschnack für seine CreativeCloud auch ein neues Tool namens VoCo…

AI goes Star Craft

AI goes Star Craft

Google und Blizzard haben gestern auf der BlizzCon eine offizielle Coop angekündigt, die StarCraft (also wohl den Code und damit…

future

Alexa Fishbot

The Future. It's beautiful. who did thispic.twitter.com/Wriy531ALr — 🦃 Wolf ウルフ (@Ouren) November 4, 2016

bildschirmfoto-2016-11-04-um-18-50-29

Once in a Lifetime-Bot ❤️

Not the same as it ever was: Der Tweetie-Bot How Did I Get Here? von Botferatu, der Lyrics für Talking…

mixed_font

Neural Style Transfer für chinesische Fonts

Interessanter Ansatz für Type-Design: Neural Style Transfer For Chinese Fonts. (via Samim) Bei der Gestaltung von chinesischen Fonts müssen zehntausende…

banklobby_example

Neural Enhance getting sharp

Neues von AI-basiertem Zoom & Enhance (Vorher auf NC: Zoom & Enhance via Neural Network Super Resolution, Neural Network Super…

bildschirmfoto-2016-11-02-um-15-31-50

Ein algorithmisches Tagebuch aller Zeiten

Gestern startete der Algo-Literatur-Wettbewerb National Novel Generation Month 2016 mit jetzt bereits rund 80 eingereichten Robot-Text-Projekten und nach einem Tag…