신경 네트워크는 텍스트 설명으로 복잡한 이미지를 만드는 법을 배웠습니다.

연구자들은 제시된 것과 매우 유사한 생성적 적대 신경망을 개발했습니다.

이전에는 Microsoft AttGAN 알고리즘입니다.차이점은 텍스트를 기반으로 이미지를 생성할 때 새로운 신경망이 객체 지향적이라는 것입니다. 즉, 원하는 텍스트를 분석하고 완성된 이미지에 라이브러리의 객체를 배치합니다.

이 알고리즘은 COCO 데이터 세트에 텍스트 설명이 수집 된 328,000 개의 개체에 대해 교육을 받았습니다.

이 연구는 제시된 신경 회로망이 작은 세부 묘사가 많이 들어있는 복잡한 객체의 텍스트 기반 설명을 만드는 데 더 효과적이라고 말합니다.

이전에, 페이스 북의 AI 실험실은 인공 지능을 도입했는데, 이것은 음식 사진으로부터이 요리의 조리법을 생성 할 수 있습니다.