ニューラルネットワークはテキスト記述によって複雑な画像を作成する方法を学びました

研究者らは、提示されたものと非常によく似た敵対的生成ニューラルネットワークを開発しました。

以前は Microsoft AttGAN アルゴリズムでした。違いは、新しいニューラルネットワークは、テキストに基づいて画像を作成するときにオブジェクト指向であることです。つまり、目的のテキストを分析し、完成した画像上にライブラリからオブジェクトをレイアウトします。

アルゴリズムは、COCOデータセットに収集されたテキスト記述を使用して、32万8000個のオブジェクトについてトレーニングされました。

この研究は、提示されたニューラルネットワークが、細部を多く含む複雑なオブジェクトのテキストベースの記述の作成によりうまく対処すると述べています。

以前、FacebookのAI研究所は食品写真からこの料理のレシピを生成できる人工知能を導入しました。

ギークテックオンライン