Prisma Style-Transfer kommt für Android und die Technik hinter der App

IMG_2604

Ich hatte vor ein paar Tagen einen Hinweis auf die russische App Prisma gepostet, die diesen ganzen NeuralNetwork-AI-Style-Transfer-Kram, über den ich schon eine ganze Weile blogge, auf's Smartphone bringt.

Good News: Alex Moiseenko veröffentlicht Prisma noch in diesem Monat für Android und die App soll schon bald auch Videos können. Auf letzteres bin ich sehr gespannt, die Ergebnisse bei Video-StyleTransfer waren zuletzt sehr schnell sehr gut geworden, wobei man dafür ungleich mehr Rechenleistung braucht, als für ein Foto.

Außerdem: ich habe eine Desktop-Variante für StyleTransfer gefunden (man muss also nicht mehr den DeepForger per Twitter bemühen), eine weitere App fürs iPhone wäre Mlvch (macht dasselbe wie Prisma, aber langsamer und das Interface suckt und man hat nur ein paar kostenlose Anwendungen frei) und Alex J. Champandard hat in einer Reihe von Tweets die Performance der App erklärt, denn solche NeuralNetwork-Anwendungen sollten eigentlich nicht auf ’nem Handy laufen können wegen Prozessorpower – und das tun sie auch nicht, Prisma läuft serverseitig:

The success of #Prisma is partly due to performance, but also that fast style currently gives better results. Original #DeepStyle imposes a "global" style distribution which ruins many pictures that have different composition. Justin's fast style [the Algorithm used by Prisma] is unable to learn a perfect "global" distribution, but coincidentally works better for most! By using smaller neural network to learn a specific style (takes 4h-6h training) it does a better job applying style in localized areas.

This is somewhat unexpected; not mentioned in original paper and I've not seen it discussed either. That insight is why #Prisma went viral. Rumour has it the app is using this open source implementation: Chainer implementation of "Perceptual Losses for Real-Time Style Transfer and Super-Resolution"… But magic is still (always) in style selection.

IMG_2605 IMG_2608 IMG_2609 IMG_2610

Algorithmic Image-Watermark Remover

Google hat ein neues Paper über die automatische Entfernung von Wasserzeichen in Pics, netterweise nennen sie das Paper „On the…

10 PRINT CHR$ (205.5 + RND (1)); on a Commodore Pet

10 PRINT CHR$ (205.5 + RND (1)); 20 GOTO 10 ist sowas wie ein Miniatur-Programm in Basic für Generative Graphics,…

DeepMind releases StarCraft AI

Google und Blizzard haben ihre StarCraft AI veröffentlicht: Testing our agents in games that are not specifically designed for AI…

Self-Driving Cars hacked with Love and Hate

Wissenschaftler der Uni Washington haben die Computer-Vision-Systeme von selbstfahrenden Autos gehackt – indem sie Love und Hate in colorierten Pixelfonts auf…

Digital Skin

Emilio Vavarella: The Digital Skin Series, 2016. „Archival inkjet prints on metallic paper. 18 elements. X:150; Y:115 cm, each.“ Von…

Cellular Automata Cube

Cubes.io: Conways Game of Life als 3D-Spielzeug mit Cubes und Spheres und Schnickschnack als Evolution-Nullpunkt, von wo aus die ganzen…

Neural Network-Faces synched to Music

„My first attempt to map a song made by @kamptweets onto GAN generated proto-faces.“ Bohemian Rhapsody next. The Three Nightingans.…

AI-Animations with human Sounds

Google vor ein paar Tagen so: „Yay, wir haben hier 'ne neue AI-based Animation-Tech, hooray!“ (Paper) Hayayo Miyazaki über AI-based…

Visual AI-Spaces Auto-Pilot

Ich habe schon ein paar mal über Mario Klingemanns Arbeiten hier gebloggt, derzeit jagt er Neural Networks durch Feedback-Loops und…

Synthesizing Obama from Audio

Im Mai bloggte ich über ein damals noch nicht veröffentlichtes Paper zur SigGraph2017, in dem sie eine Methode für generative…

Generative Pearls

Cool fractal and generative art by Julien Leonard. I dig his explanation from his about-page: „I create algorithms that connect…