A fost creat un instrument care ajută la eliminarea prejudecăților în vederea computerizată

Deși sursele de părtinire în sistemele AI sunt variate, una dintre cauzele principale este stereotipul.

imagini cuprinse în seturi maridate colectate din surse online pe care inginerii le folosesc pentru a dezvolta viziunea computerizată. Aceasta este o ramură a AI care permite computerelor să recunoască oameni, obiecte și acțiuni. Deoarece fundamentul vederii computerizate se bazează pe aceste seturi de date, imaginile care reflectă stereotipuri și părtiniri sociale pot influența în mod neintenționat modelele de viziune computerizată.

Pentru a ajuta la rezolvarea acestei probleme în eaInițial, cercetătorii de la Princeton Visual AI Lab au dezvoltat un instrument open source care detectează automat potențialele corupții în seturile de date vizuale. Instrumentul permite creatorilor de seturi de date și utilizatorilor să corecteze subrepresentarea sau problemele de imagine stereotipate înainte ca colecțiile de imagini să fie utilizate pentru a instrui modele de viziune computerizată. În lucrările conexe, membrii Visual AI Lab au publicat o comparație a tehnicilor existente de prevenire a prejudecății în modele de viziune computerizată și au propus o nouă abordare mai eficientă pentru reducerea prejudecății.

Primul instrument, numit REVISE, foloseștemetode statistice pentru a examina un set de date pentru posibile părtiniri sau probleme de subreprezentare pe trei dimensiuni: obiect, gen și geografie. 

REVISE evaluează conținutul setului de date,folosind adnotări și măsurători de imagini existente, cum ar fi numărul de obiecte, prezența combinată a obiectelor și a oamenilor și țara de origine a imaginilor. Printre aceste măsurători, instrumentul identifică modele care diferă de distribuția mediană.

Într-un singur set de date, REVISE a identificat un potențialpărtinire de gen în imagini care înfățișează oameni (dreptunghiuri roșii) și organul unui instrument muzical (dreptunghiuri albastre). O analiză a distribuției distanțelor tridimensionale estimate între o persoană și un organ a arătat că bărbații erau de obicei descriși ca jucând efectiv instrumentul, în timp ce femeile erau adesea pur și simplu în același spațiu ca instrumentul. Credit: Princeton Visual AI Lab.

De exemplu, într-unul dintre seturile testateDatele REVISE au arătat că imaginile care implică oameni și flori diferă între bărbați și femei: bărbații aveau mai multe șanse să apară cu flori la ceremonii sau întâlniri, iar femeile au mai multe șanse să apară în scene sau picturi. 

Odată ce instrumentul detectează acest tip dediscrepanțe, „se pune întrebarea dacă acesta este un fapt complet inofensiv sau dacă se întâmplă ceva mai important, iar acest lucru este foarte greu de automatizat”, explică Olga Rusakovskaya, profesor asistent de informatică și investigator principal al Visual AI Lab.  

„Practica colectării seturilor de date în computerștiința până de curând nu a fost studiată atât de amănunțit ”, concluzionează co-autorul Angelina Wang, absolventă de informatică. Ea explică faptul că imaginile sunt în mare parte „de pe Internet și oamenii nu înțeleg întotdeauna că imaginile lor sunt folosite [în seturile de date]. Trebuie să colectăm imagini de la mai multe grupuri de oameni și să o facem cu respect. "

Citește și:

Este posibil să se creeze un reactor termonuclear pe Pământ. Care vor fi consecințele?

Ghețarul Doomsday s-a dovedit a fi mai periculos decât credeau oamenii de știință. Spunem principalul lucru

În ziua a 3-a de boală, majoritatea pacienților cu COVID-19 își pierd simțul mirosului și suferă adesea de un nas curgător