Text 2 Bird

Gepostet vor 2 Monaten, 2 Tagen in #Science #Tech #AI #AlgoCulture #Birds

Share: Twitter Facebook Mail

b00a

Neural Networks generieren Vögel aus Textbeschreibungen in 256x256 Pixeln (das nennen AI-Forscher „High Res“, haha). Die Methode sah qualitätsmäßig vor ein paar Monaten noch weitaus schlimmer aus und beschränkte sich oft auf 64x64 Pixel. Wir sind zwar noch ein paar Schritte entfernt von „Siri, generate a Böhmermann in blau and Trump-Hair and make him sing 'Nazi Punks Fuck Off'“, aber das zeichnet sich definitiv bereits am futuristischen Horizont ab. Wenn dann die Fake-Videos mit jedem und allem Youtube flooden, können wir ja nochmal über „Fake-News“ reden. We ain't seen nothing yet.

Paper: StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks (via Procedural Generation)

b1dAbstract:
Synthesizing photo-realistic images from text descriptions is a challenging problem in computer vision and has many practical applications. Samples generated by existing text-to-image approaches can roughly reflect the meaning of the given descriptions, but they fail to contain necessary details and vivid object parts. In this paper, we propose stacked Generative Adversarial Networks (StackGAN) to generate photo-realistic images conditioned on text descriptions.

The Stage-I GAN sketches the primitive shape and basic colors of the object based on the given text description, yielding Stage-I low resolution images. The Stage-II GAN takes Stage-I results and text descriptions as inputs, and generates high resolution images with photorealistic details. The Stage-II GAN is able to rectify defects and add compelling details with the refinement process.

Samples generated by StackGAN are more plausible than those generated by existing approaches. Importantly, our StackGAN for the first time generates realistic 256 × 256 images conditioned on only text descriptions, while state-of-the-art methods can generate at most 128 × 128 images. To demonstrate the effectiveness of the proposed StackGAN, extensive experiments are conducted on
CUB and Oxford-102 datasets, which contain enough object appearance variations and are widely-used for text-toimage generation analysis.

b0 b1 b1a b1b b1c b2 b3

Automatic Handgun Detection via Machine Learning

The latest Step into an OCP-approved Ed-209-compatible Future: Automatic Handgun Detection Alarm in Videos Using Deep Learning (PDF). Usage Guide:…

ALF-Trump and other algorithmic Abominations

Großartiger neuer Twitter-Feed von Chris Rodley: Algorithmic Horror – Concept art for horror movies generated by an algorithm mit so…

Algorithmic Shape Collages

Interessantes Paper der Uni Hong Kong über automatisierte Shape Collagen (mit geilem Titel auch): Pyramid of Arclength Descriptor for Generating…

Cube-Transformation-Bot

Ganz großartiger Bot von Andrew Heumann: Tweet2Form: The Formalist Tweetbot. Das Teil versteht 11 verschiedene Befehle für 3D-Transformationen, führt die…

Cybernetic Serendipity 1968

Nice Walkthrough for the 1968 Cybernetic Serendipity-Exhibition at the Institute of Contemporary Arts in London. Some cool, early, experimental Machine-Typography…

Der Sünden-Bot

Mein Buddy Gregor macht wieder Unfug mit Tweetie-Bots, diesmal eine Metapher auf die panische Scheindebatte über den Angriff der killeralienmutant…

Google Brain does Zoom & Enhance

Vor grob einem halben Jahr bloggte ich über eine Reihe von Papers, die eine neue AI-Anwendung vorstellten: Image Super-Resolution. Die…

NSA-Powerpoint-Styletransfer: Snowden.ppt

Matthew Plummer-Fernandez hat einen Style-Transfer-Algorithmus auf verschiedene NSA-Powerpoint-Slides trainiert und daraus ein paar Snowden-Portraits generiert: Snowden.ppt. Machine Learning style transfer…

Algorithmic Cyclops

Mario Klingemann trainiert wieder irgendwelche Neural Networks die wieder irgendwelche komischen Sachen generieren. Diesmal hat er ’nen Algorithmus auf vintage…

Hieronymus Bosch dreaming of Sesame Street

Chris Rodley dreht nach dem Trump Clan ein paar klassische Gemälde von Picasso und Hieronymus Bosch durch den Sesamstraßen-Neural-Network-Wolf:

80 motherfucking Hawks on a motherfucking Plane

Reddit: „My captain friend sent me this photo. Saudi prince bought ticket for his 80 hawks.“ At least they're flying…