Textul poate fi acum transformat într-un videoclip. AI a învățat asta din mii de ore de înregistrare

O echipă de ingineri de învățare automată de la compania-mamă a Facebook, Meta (identificată ca extremistă)

organizație, activitățile sunt interzise ptteritoriul Federației Ruse) a introdus un nou sistem numit Make-A-Video. După cum sugerează și numele, acest model AI realizează videoclipuri. Funcționează simplu: utilizatorul introduce o descriere aproximativă a scenei, iar sistemul generează un scurt videoclip corespunzător textului.

„ursuleț pictând un portret”

Într-un mesaj care anunță Make-a-Video, companiaobservă că instrumentele de creare video sunt neprețuite „pentru creatorii de conținut și artiști”. Dar, ca și în cazul modelelor text-to-image, există perspective îngrijorătoare. Rezultatele acestor instrumente pot fi folosite pentru dezinformare și propagandă.

Stânga sus:un câine într-o pelerină de super-erou zboară prin cer. Dreapta sus: nava spațială aterizează pe Marte. Stânga jos: Pensula artistului pictează pe pânză în prim-plan, în detaliu. Dreapta jos: apă potabilă pentru cal.

Într-un document care descrie detaliile tehnicemodele, autorii dezvoltării spun cum funcționează. Make-A-Video este instruit pe perechi imagine-titlu, precum și pe înregistrări video neetichetate. Conținutul de instruire a fost obținut din două seturi de date (WebVid-10M și HD-VILA-100M). Acestea conțin milioane de videoclipuri cu sute de mii de ore de filmare. Există, de asemenea, videoclipuri stoc create de site-uri precum Shutterstock și videoclipuri aleatorii de pe Internet.

Până acum, Make-A-Video produce 16 cadre video la 64 x 64 pixeli, care sunt apoi scalate la 768 x 768 folosind un model AI separat.

Citeste mai mult:

S-a dovedit ce se întâmplă cu creierul uman după o oră în pădure

A devenit cunoscut care ceai distruge proteinele din creier

Creaturile marine ciudate din adâncurile oceanului s-au dovedit a fi asemănătoare cu oamenii