Das neuronale Netzwerk lernte, wie komplexe Bilder durch eine Textbeschreibung erzeugt werden

Forscher haben ein generatives kontradiktorisches neuronales Netzwerk entwickelt, das dem vorgestellten sehr ähnlich ist.

ehemals Microsoft AttGAN-Algorithmus.Der Unterschied besteht darin, dass das neue neuronale Netzwerk bei der Erstellung von Bildern basierend auf Text objektorientiert ist – das heißt, es analysiert den gewünschten Text und legt Objekte aus der Bibliothek auf dem fertigen Bild an.

Der Algorithmus wurde an 328.000 Objekten mit einer im COCO-Datensatz gesammelten Textbeschreibung trainiert.

Die Studie besagt, dass das vorgestellte neuronale Netzwerk die Erstellung einer textbasierten Beschreibung komplexer Objekte mit vielen kleinen Details besser beherrscht.

Zuvor hatte das Facebook AI-Labor künstliche Intelligenz eingeführt, die aus Lebensmittelfotos ein Rezept für dieses Gericht generieren kann.