Google AI learns important Stuff

Gepostet vor 9 Monaten, 29 Tagen in #Tech #AI #AlgoCulture

Share: Twitter Facebook Mail

bask

Neues Paper von Google AI, deren Bilderkennung jetzt zwischen wichtigen und unwichtigen Inhalten in Videos unterscheiden kann. Vor zwei Monaten reichte es noch „nur“ für auflistende Bildbeschreibungen, jetzt weiß das Teil dank einer „Aufmerksamkeitsmaske“, welche Gegenstände oder Akteure am bedeutendsten sind. Der Algorithmus benötigt allerdings eine Videoquelle, um die Wichtigkeit aus einer Timeline zu berechnen, mit Fotos funktioniert das (noch) nicht. Natürlich ideal für die Überwachung von öffentlichen Plätzen und sowas. PDF: Detecting events and key actors in multi-person videos.

Multi-person event recognition is a challenging task, often with many people active in the scene but only a small subset contributing to an actual event. In this paper, we propose a model which learns to detect events in such videos while automatically “attending” to the people responsible for the event. Our model does not use explicit annotations regarding who or where those people are during training and testing. In particular, we track people in videos and use a recurrent neural network (RNN) to represent the track features. We learn time-varying attention weights to combine these features at each time-instant. The attended features are then processed using another RNN for event detection/classification.

Since most video datasets with multiple people are restricted to a small number of videos, we also collected a new basketball dataset comprising 257 basketball games with 14K event annotations corresponding to 11 event classes. Our model outperforms state-of-the-art methods for both event classification and detection on this new dataset. Additionally, we show that the attention mechanism is able to consistently localize the relevant players.

Predictive Policing for Banksters

Schönes Ding von Sam Lavigne, Predictive Policing für Wirtschaftskriminalität im Finanzsektor, 'ne Robocop-App für Bankster. White Collar Crime Risk Zones…

AI Voice-Cloning

Vor ein paar Monate veröffentlichte Google sein WaveNet, ein auf Stimmen trainiertes Neurales Netzwerk mit einem deutlichen Qualitätssprung gegenüber bisherigen…

Neural Network cooks with Cthulhu

Janelle Shane spielt mit Neural Networks rum und hat eins davon auf Lovecraft trainiert. Dann hat sie das Neural Network…

Next Level, photorealistic Style-Transfer

In ihrem neuen Paper stellen Fujun Luan, Sylvain Paris, Eli Shechtman und Kavita Bala eine neue Style-Transfer-Methode vor: Figure 1:…

Blacked Out Censorship-Poetry Generator

Schöne Spielerei von Max Kreminski, ein JS-Droplet, das Websites in Blacked Out Poetry verwandelt, basierend auf Liza Dalys █ Blackout…

This Bot kills Fascists

So-So-Working-Object-Detection-Algorithm + Woodie Guthrie = Fascists.exe | „This bot kills fascists“.

„Alexa? Are you connected to the CIA?“

„I always try to tell the truth.“ This reminds me of those Guilty-Dog-Videos:

Palm Generator

Es sollte mehr entspannte Algorithmen mit Urlaubs-Attitüde geben wie den hier: „The Palm Generator is a Three.js module to create…

AI Brainscans

Graphcore aus Bristol visualisieren künstliche Intelligenzen und Neural Networks: Inside an AI 'brain' - What does machine learning look like?…

A Banana Keytar and more from Stupid Hackathon: Inverted Eyetracker-Pong, Robot Porn Addict or the Shitty Sharpie Tattoo Gun)

Ein weiterer Fav vom Stupid Hackathon NYC 2017, die Banana-Keytar von Amanda Lange. Auch geil: der Twitter-Bot Robot Porn Addiction,…

Fotorealistische Pics aus der Gameboy-Camera

Roland Meertens generiert fotorealistische Farbbilder aus den Pics der Gameboy-Camera: Creating photorealistic images with neural networks and a Gameboy Camera.…