Нейросеть навчилася створювати складні зображення по текстовому опису

Дослідники розробили генеративно-змагальну нейросеть, яка дуже схожа на представлений

раніше Microsoft алгоритм AttGAN. Відмінність полягає в тому, що нова нейросеть при створенні зображень на основі тексту орієнтується на об'єкти - іншими словами, вона аналізує потрібний текст і розкладає об'єкти з бібліотеки на готовому зображенні.

Алгоритм навчався на 328 тис. Об'єктах з текстовим описом, зібраних в датасета COCO.

У дослідженні говориться, що представлена ​​нейросеть краще за інших алгоритмів справляється зі створенням по текстовому опису складних об'єктів, в яких міститься безліч дрібних деталей.

Раніше лабораторія Facebook AI представила штучний інтелект, який може по фотографіях їжі згенерувати власний рецепт приготування цієї страви.