تعلمت الشبكة العصبية كيفية إنشاء صور معقدة من خلال وصف النص

طور الباحثون شبكة عصبية تناسلية تشبه إلى حد كبير الشبكة العصبية

خوارزمية Microsoft AttGAN السابقة. الفرق هو أنه عند إنشاء صور تستند إلى نص ، فإن شبكة عصبية جديدة تركز على الكائنات - وبعبارة أخرى ، تقوم بتحليل النص الضروري وتضع الكائنات من المكتبة على الصورة النهائية.

تم تدريب الخوارزمية على 328 ألف كائن مع وصف النص الذي تم جمعه في مجموعة بيانات COCO.

تقول الدراسة أن الشبكة العصبية المقدمة تتواءم بشكل أفضل مع إنشاء وصف قائم على النص للكائنات المعقدة التي تحتوي على العديد من التفاصيل الصغيرة.

في وقت سابق ، قدم مختبر Facebook AI الذكاء الاصطناعي ، والذي يمكن أن يولد وصفة لهذا الطبق من الصور الغذائية.