Google Brain does Zoom & Enhance

Gepostet vor 16 Tagen in #Science #Tech #AI #AlgoCulture

Share: Twitter Facebook Mail

gggg

Vor grob einem halben Jahr bloggte ich über eine Reihe von Papers, die eine neue AI-Anwendung vorstellten: Image Super-Resolution. Die ermöglichte es theoretisch, in extrem grob aufgelöste Bilder „hinein zu zoomen“. Was ja aus Prinzip nicht gehen sollte, da man keine Bild-Information aus dem Nichts erschaffen kann. Neural Networks werden hier jetzt mit jeder Menge Bild-Material gefüttert und die errechnen nun während des „Zooms“ die wahrscheinlichsten Muster/Pixelanordnungen.

Googles AI-Abteilung Brain hat nun praktisch dasselbe gemacht und die Ergebnisse unterscheiden sich nicht wesentlich vom Stand 09/2016, auch Google erzeugt „nur“ annehmbare Ergebnisse für einen vierfachen Zoom-Faktor (im September 2016 zoomten sie 16x16 Pixel-Pics auf 64x64 Pixel, Google zoomt 8x8 Pixel auf 32x32 Pixel), wobei die Verbesserungen in Googles Verfahren anscheinend vor allem im Detail (Randbereiche der Bilder) zu finden sind.

gb1ArsTechnica: Google Brain super-resolution image tech makes “zoom, enhance!” real

The first part, the conditioning network, tries to map the the 8×8 source image against other high resolution images. It downsizes other high-res images to 8×8 and tries to make a match.

The second part, the prior network, uses an implementation of PixelCNN to try and add realistic high-resolution details to the 8×8 source image. Basically, the prior network ingests a large number of high-res real images—of celebrities and bedrooms in this case. Then, when the source image is upscaled, it tries to add new pixels that match what it "knows" about that class of image. For example, if there's a brown pixel towards the top of the image, the prior network might identify that as an eyebrow: so, when the image is scaled up, it might fill in the gaps with an eyebrow-shaped collection of brown pixels.

To create the final super-resolution image, the outputs from the two neural networks are mashed together. The end result usually contains the plausible addition of new details.

Neural Enhance auf Nerdcore: Neural Enhance with creepy artificial Artifacts, Neural Enhance getting sharp, Zoom & Enhance via Neural Network Super Resolution

Paper: Pixel Recursive Super Resolution (PDF)

Abstract: We present a pixel recursive super resolution model that synthesizes realistic details into images while enhancing their resolution. A low resolution image may correspond to multiple plausible high resolution images, thus modeling the super resolution process with a pixel independent conditional model often results in averaging different details – hence blurry edges. By contrast, our model is able to represent a multimodal conditional distribution by properly modeling the statistical dependencies among the high resolution image pixels, conditioned on a low resolution input. We employ a PixelCNN architecture to define a strong prior over natural images and jointly optimize this prior with a deep conditioning convolutional network. Human evaluations indicate that samples from our proposed model look more photo realistic than a strong L2 regression baseline.

goog goog2 goog3 goog4 goog5

Pix2Pix: Neural Network Katzen-Compositing als Browsertoy

Schönes Spielzeug von Christopher Hesse, der ein Neural Network auf Bild-Paaren trainiert hat und mit dem man nun Katzen, Schuhe…

Automatic Handgun Detection via Machine Learning

The latest Step into an OCP-approved Ed-209-compatible Future: Automatic Handgun Detection Alarm in Videos Using Deep Learning (PDF). Usage Guide:…

ALF-Trump and other algorithmic Abominations

Großartiger neuer Twitter-Feed von Chris Rodley: Algorithmic Horror – Concept art for horror movies generated by an algorithm mit so…

Algorithmic Shape Collages

Interessantes Paper der Uni Hong Kong über automatisierte Shape Collagen (mit geilem Titel auch): Pyramid of Arclength Descriptor for Generating…

Cube-Transformation-Bot

Ganz großartiger Bot von Andrew Heumann: Tweet2Form: The Formalist Tweetbot. Das Teil versteht 11 verschiedene Befehle für 3D-Transformationen, führt die…

Cybernetic Serendipity 1968

Nice Walkthrough for the 1968 Cybernetic Serendipity-Exhibition at the Institute of Contemporary Arts in London. Some cool, early, experimental Machine-Typography…

Der Sünden-Bot

Mein Buddy Gregor macht wieder Unfug mit Tweetie-Bots, diesmal eine Metapher auf die panische Scheindebatte über den Angriff der killeralienmutant…

NSA-Powerpoint-Styletransfer: Snowden.ppt

Matthew Plummer-Fernandez hat einen Style-Transfer-Algorithmus auf verschiedene NSA-Powerpoint-Slides trainiert und daraus ein paar Snowden-Portraits generiert: Snowden.ppt. Machine Learning style transfer…

Algorithmic Cyclops

Mario Klingemann trainiert wieder irgendwelche Neural Networks die wieder irgendwelche komischen Sachen generieren. Diesmal hat er ’nen Algorithmus auf vintage…

Hieronymus Bosch dreaming of Sesame Street

Chris Rodley dreht nach dem Trump Clan ein paar klassische Gemälde von Picasso und Hieronymus Bosch durch den Sesamstraßen-Neural-Network-Wolf: