Neural Network makes some Logos


Alexander Sage hat ein Neural Network auf ein Dataset von 600k Logos trainiert und erkundet den Logo-Space (genauer: Den Signet-Space, Logos sind oft die Kombination aus Signet und Firmenname in Haustypo, die Wort-Bild-Marke). Der Algorithmus hier beschränkt sich meist auf das Signet, Typo kriegen die Maschinen noch nicht vernünftig hin. Die Auflösung ist mit 32x32 Pixeln ebenfalls (noch) nicht der Rede wert, wobei grade hier anderenorts gute Fortschritte erzielt werden und offenbar basiert das Logo-Dataset auf Favicons und das Ergebnis ist dem entsprechend eher… experimentell.

Zum Brainstorming und zur Visualisierung und Kombination einiger visueller Eigenschaften reicht das allerdings jetzt bereits: Format, prinzipielle Raumaufteilung, Form, Farben, diese Dinge kann der Algorithmus schon jetzt massenweise ausspucken mit einem Klick (und ein bisschen Rechenzeit und Training und allem was dazugehört, aber wir haben bei der Prisma-App bereits gesehen, wie schnell die Dinge Standard werden). Das Ergebnis muss zum Schluss nur noch von Photoshop-Philip saubergeklickt werden, das baut schnell einer nach. Was der Code hier ausspuckt ist die erste Phase meines gelernten Berufs, die Ideenfindung, in der man viel in masse, schnelle Layouts, Anordnungen, hingepfuscht und noch einmal miteinander kombiniert, solange es zum Sujet passt. Das kann man demnächst alles online zusammenklicken.

Der Kicker ist: Das ist der Bulk meines alten Jobs, da passiert auch grade bei größeren Projekten der meiste Aufwand, die Kommunikation mit dem Kunden, doch Serifen oder keine, das Rot doch 5% mehr Cyan oder nicht, die Abstimmung, die ganzen Geschmackbefindlichkeiten, und bei ganz großen Projekten kommt dann auch Politik hinzu (das ist der eigentliche Grund, warum das Arbeitsamt-Logo so teuer ist, nicht weil das Logozusammenklicken auf einmal teurer geworden ist, sondern weil das Logo im ganzen Land mit allen Entscheidern abgestimmt wird). Wenn man den Algorithmus nun zu Ende denkt, fällt genau der Bulk dieses Prozesses in ein paar Jahren weg und von der Kommunikationsagentur bleibt die Maschine und der eine Mensch übrig, der das Ergebnis sauberklickt – literally.

Die haben anscheinend auch gleich einen Logo-Generator gebaut, einen Link dazu habe ich leider nicht gefunden, aber falls sich noch wer an KaisPowerTools erinnert: „The user is able to choose either vicinity sampling or class transfer to modify the image in a chosen semantic direction. For both methods, 8 random variations are arranged around the current logo. Upon selecting the appropriate sample, the current logo can be modified by a variable amount using the slider at the bottom of the window. After confirming the selected modification, the process starts over again from the newly modified logo, until the desired appearance is reached.“

Verschmierte 32x32-Icons werden meinen alten Beruf jetzt noch nicht morgen beenden und bis ein Algo überzeugende Typo hinbekommt, wird nochmal mehr Zeit vergehen, aber gib dem noch 5 Jahre, ein anständiges Data-Set und Vektoren, dann geht da einiges. Das lustige ist dabei: Der Algorithmus macht jetzt bereits nichts anderes, als die Los Logos-Bücher seit den 90s, nur in hässlicher, was die Disruption gleichzeitig sehr schön illustriert.

Paper: Logo Synthesis and Manipulation with Clustered Generative Adversarial Networks

Designing a logo for a new brand is a lengthy and tedious back-and-forth process between a designer and a client. In this paper we explore to what extent machine learning can solve the creative task of the designer. For this, we build a dataset – LLD – of 600k+ logos crawled from the world wide web. Training Generative Adversarial Networks (GANs) for logo synthesis on such multi-modal data is not straightforward and results in mode collapse for some state-of-the-art methods. We propose the use of synthetic labels obtained through clustering to disentangle and stabilize GAN training. We are able to generate a high diversity of plausible logos and we demonstrate latent space exploration techniques to ease the logo design task in an interactive manner. Moreover, we validate the proposed clustered GAN training on CIFAR 10, achieving state-of-theart Inception scores when using synthetic labels obtained via clustering the features of an ImageNet classifier. GANs can cope with multi-modal data by means of synthetic labels achieved through clustering, and our results show the creative potential of such techniques for logo synthesis and manipulation. Our dataset and models will be made publicly available at https://data.vision.ee.ethz.ch/cvl/lld/.