เครือข่ายประสาทเทียมของ Apple เพียงพอสำหรับวิดีโอ 10 วินาทีเพื่อสร้าง Deepfake ที่สมจริง

Apple ได้พัฒนาโครงข่ายประสาทเทียมที่เรียกว่า NeuMan ซึ่งเรียนรู้จากวิดีโอสั้นและสามารถสร้างได้

วิดีโอ "ดีพเฟค"

ในการฝึกโครงข่ายประสาทเทียม การถ่ายวิดีโอความยาว 10 วินาทีด้วยกล้องที่กำลังเคลื่อนไหวก็เพียงพอแล้ว โปรแกรมจะดึงภาพบุคคลและสภาพแวดล้อมออกจากวิดีโอ

หลังจากนั้น NeuMan สามารถสังเคราะห์คลิปได้บนซึ่งตัวละครตัวเดียวกันจะทำการกระทำที่แตกต่างกัน เช่น เต้น ตีลังกา หรือกระโดด วิดีโอใหม่มีความคมชัดน้อยกว่า แต่โดยทั่วไปแล้ว ดูเหมือนฟุตเทจคุณภาพต่ำจริงๆ

วิดีโอสาธิต: คนเต้น. วิดีโอ: Apple

วัตถุประสงค์หลักของโปรแกรมตามที่ระบุไว้นักพัฒนาเป็นแอพพลิเคชั่นสำหรับเติมความเป็นจริง พวกเขายังทราบด้วยว่าแบบจำลอง NeRF (การแผ่รังสีประสาท) สองแบบใช้เพื่อฝึกโครงข่ายประสาทเทียม: แบบแรกศึกษาบุคคลและแบบที่สองศึกษาภูมิหลัง ด้วยความช่วยเหลือของแบบจำลองเหล่านี้ โครงข่ายประสาทเทียมจะเรียนรู้เรขาคณิตคร่าวๆ ของบุคคลและฉาก แล้วสร้างใหม่ได้ในรูปแบบใหม่

วิดีโอสาธิต: กำลังชาร์จ วิดีโอ: Apple

ในขณะเดียวกัน ตามที่นักวิจัยตั้งข้อสังเกต ท่าที่บุคคลใช้ระหว่างการถ่ายภาพไม่ส่งผลต่อคุณภาพของวิดีโอที่ถ่ายเสร็จแล้ว

อ่านเพิ่มเติม:

บันทึกการขับมวลโคโรนาที่ Betelgeuse มีขนาดใหญ่กว่าดวงอาทิตย์ 400 พันล้านเท่า

เมกาโลดอนกินสัตว์ขนาดเท่าวาฬเพชฌฆาตในแต่ละครั้ง

เอเวอเรสต์พบร่องรอยของ DNA ที่ไม่ควรอยู่ที่นั่น