Neural Network Super Resolution getting good, fast

Gepostet vor 8 Monaten, 7 Tagen in #Design #Science #Tech #AI #AlgoCulture

Share: Twitter Facebook Mail

enhance

Neulich bloggte ich über die K.I.-Version der Zoom & Enhance-Meme und meinte noch, das seien ja nur 64x64 Pixel und die Ergebnisse wären ja noch eher so mittel. Scratch that. Ein neues Paper stellt eine neue Methode (SRGAN) zum neural-network-gestützten hochrechnen von Bildern vor, das dramatisch bessere Ergebnisse erzielt, in dem es Informationsverluste in den Texturen durch gelernte Algo-Pattern ausgleicht. Zoom & Enhance is coming!

enhance2

Despite the breakthroughs in accuracy and speed of single image super-resolution using faster and deeper convolutional neural networks, one central problem remains largely unsolved: how do we recover the finer texture details
when we super-resolve at large upscaling factors? During image downsampling information is lost, making superresolution a highly ill-posed inverse problem with a large set of possible solutions. The behavior of optimizationbased super-resolution methods is therefore principally driven by the choice of objective function. Recent work has largely focussed on minimizing the mean squared reconstruction error (MSE). The resulting estimates have high peak signal-to-noise-ratio (PSNR), but they are often overly smoothed, lack high-frequency detail, making them perceptually unsatisfying.

In this paper, we present superresolution generative adversarial network (SRGAN). To our knowledge, it is the first framework capable of recovering photo-realistic natural images from 4× downsampling. To achieve this, we propose a perceptual loss function which consists of an adversarial loss and a content loss. The adversarial loss pushes our solution to the natural image manifold using a discriminator network that is trained to differentiate between the super-resolved images and original photo-realistic images. In addition, we use a content loss function motivated by perceptual similarity instead of similarity in pixel space. Trained on 350K images using the perceptual loss function, our deep residual network was able to recover photo-realistic textures from heavily downsampled images on public benchmarks.

Heute in Darmstadt: Das Geile Neue Internet – Potential of (visible) Infinite Idea Space

[update] Hier ein Livestream auf Facebook. Heute abend erzähle ich auf dem Webmontag Darmstadt – Born and raised Heiner, gude!…

Smile-Filtering a Face until there is no Face left to smile-filter

Gene Kogan: „just in case you were wondering, this is what happens when you repeatedly run FaceApp’s smile filter until…

Neural Network dreams your Dreams

Wissenschaftler können bereits seit Jahren Bilder aus Gehirnscans extrahieren, also: Tatsächlich ein Abbild davon schaffen, was wir sehen. Die Resultate…

Neural Network dreams of riding a Train

Tolle Arbeit von Damien Henry: Ein Neural Network, ein sogenannter „prediction algorithm“, der Frames eines Videos „errät“, ausgehend vom jeweils…

4 AI-Obamas learn Algo-Lipsynch from Audio

Seit ich über die neuen Möglichkeiten von Machine Learning bezüglich Computer Vision und der Generation von Bildern schreibe, vor allem…

Daddy Cthulhu Cumshot: Weird Algo-Poetry from repetitive Cut'n'Paste-Autocomplete

Das LanguageLog hat die „psychedellic“ AI-„Dreaming of“-Technik auf Google Translate angewandt und dort regelmäßige Sprach/Zeichen-Muster („Iä! Iä! Iä! Iä! Iä!…

Neural Networks for Character Control

Daniel Holden, Taku Komura und Jun Saito haben ein Neural Network auf Character-Animationen trainiert, mit dem Figuren in Games und…

Predictive Policing for Banksters

Schönes Ding von Sam Lavigne, Predictive Policing für Wirtschaftskriminalität im Finanzsektor, 'ne Robocop-App für Bankster. White Collar Crime Risk Zones…

AI Voice-Cloning

Vor ein paar Monate veröffentlichte Google sein WaveNet, ein auf Stimmen trainiertes Neurales Netzwerk mit einem deutlichen Qualitätssprung gegenüber bisherigen…

Neural Network cooks with Cthulhu

Janelle Shane spielt mit Neural Networks rum und hat eins davon auf Lovecraft trainiert. Dann hat sie das Neural Network…

Next Level, photorealistic Style-Transfer

In ihrem neuen Paper stellen Fujun Luan, Sylvain Paris, Eli Shechtman und Kavita Bala eine neue Style-Transfer-Methode vor: Figure 1:…