Google Brain does Zoom & Enhance

Gepostet vor 6 Monaten, 13 Tagen in #Science #Tech #AI #AlgoCulture

Share: Twitter Facebook Mail

gggg

Vor grob einem halben Jahr bloggte ich über eine Reihe von Papers, die eine neue AI-Anwendung vorstellten: Image Super-Resolution. Die ermöglichte es theoretisch, in extrem grob aufgelöste Bilder „hinein zu zoomen“. Was ja aus Prinzip nicht gehen sollte, da man keine Bild-Information aus dem Nichts erschaffen kann. Neural Networks werden hier jetzt mit jeder Menge Bild-Material gefüttert und die errechnen nun während des „Zooms“ die wahrscheinlichsten Muster/Pixelanordnungen.

Googles AI-Abteilung Brain hat nun praktisch dasselbe gemacht und die Ergebnisse unterscheiden sich nicht wesentlich vom Stand 09/2016, auch Google erzeugt „nur“ annehmbare Ergebnisse für einen vierfachen Zoom-Faktor (im September 2016 zoomten sie 16x16 Pixel-Pics auf 64x64 Pixel, Google zoomt 8x8 Pixel auf 32x32 Pixel), wobei die Verbesserungen in Googles Verfahren anscheinend vor allem im Detail (Randbereiche der Bilder) zu finden sind.

gb1ArsTechnica: Google Brain super-resolution image tech makes “zoom, enhance!” real

The first part, the conditioning network, tries to map the the 8×8 source image against other high resolution images. It downsizes other high-res images to 8×8 and tries to make a match.

The second part, the prior network, uses an implementation of PixelCNN to try and add realistic high-resolution details to the 8×8 source image. Basically, the prior network ingests a large number of high-res real images—of celebrities and bedrooms in this case. Then, when the source image is upscaled, it tries to add new pixels that match what it "knows" about that class of image. For example, if there's a brown pixel towards the top of the image, the prior network might identify that as an eyebrow: so, when the image is scaled up, it might fill in the gaps with an eyebrow-shaped collection of brown pixels.

To create the final super-resolution image, the outputs from the two neural networks are mashed together. The end result usually contains the plausible addition of new details.

Neural Enhance auf Nerdcore: Neural Enhance with creepy artificial Artifacts, Neural Enhance getting sharp, Zoom & Enhance via Neural Network Super Resolution

Paper: Pixel Recursive Super Resolution (PDF)

Abstract: We present a pixel recursive super resolution model that synthesizes realistic details into images while enhancing their resolution. A low resolution image may correspond to multiple plausible high resolution images, thus modeling the super resolution process with a pixel independent conditional model often results in averaging different details – hence blurry edges. By contrast, our model is able to represent a multimodal conditional distribution by properly modeling the statistical dependencies among the high resolution image pixels, conditioned on a low resolution input. We employ a PixelCNN architecture to define a strong prior over natural images and jointly optimize this prior with a deep conditioning convolutional network. Human evaluations indicate that samples from our proposed model look more photo realistic than a strong L2 regression baseline.

goog goog2 goog3 goog4 goog5

Algorithmic Image-Watermark Remover

Google hat ein neues Paper über die automatische Entfernung von Wasserzeichen in Pics, netterweise nennen sie das Paper „On the…

10 PRINT CHR$ (205.5 + RND (1)); on a Commodore Pet

10 PRINT CHR$ (205.5 + RND (1)); 20 GOTO 10 ist sowas wie ein Miniatur-Programm in Basic für Generative Graphics,…

DeepMind releases StarCraft AI

Google und Blizzard haben ihre StarCraft AI veröffentlicht: Testing our agents in games that are not specifically designed for AI…

Self-Driving Cars hacked with Love and Hate

Wissenschaftler der Uni Washington haben die Computer-Vision-Systeme von selbstfahrenden Autos gehackt – indem sie Love und Hate in colorierten Pixelfonts auf…

Cellular Automata Cube

Cubes.io: Conways Game of Life als 3D-Spielzeug mit Cubes und Spheres und Schnickschnack als Evolution-Nullpunkt, von wo aus die ganzen…

Neural Network-Faces synched to Music

„My first attempt to map a song made by @kamptweets onto GAN generated proto-faces.“ Bohemian Rhapsody next. The Three Nightingans.…

AI-Animations with human Sounds

Google vor ein paar Tagen so: „Yay, wir haben hier 'ne neue AI-based Animation-Tech, hooray!“ (Paper) Hayayo Miyazaki über AI-based…

Visual AI-Spaces Auto-Pilot

Ich habe schon ein paar mal über Mario Klingemanns Arbeiten hier gebloggt, derzeit jagt er Neural Networks durch Feedback-Loops und…

Synthesizing Obama from Audio

Im Mai bloggte ich über ein damals noch nicht veröffentlichtes Paper zur SigGraph2017, in dem sie eine Methode für generative…

Generative Pearls

Cool fractal and generative art by Julien Leonard. I dig his explanation from his about-page: „I create algorithms that connect…

Moarph

Mario Klingemann does some weird shit again with CycleGAN Feedback Loops (Neural Networks feeding their results back to each other).…