Definiția textului, VR și dronelor: modul în care viziunea computerizată elimină rutina, dar amenință datele

Cum a început totul

Pentru a învăța un computer să „vadă”, mai întâi aveți nevoie de un senzor care citește

informații din spațiul înconjurător și le transformă într-o imagine. A doua componentă este un program pentru procesarea acestei imagini.

Textul tipărit s-a dovedit a fi un test perfectreprezintă prima generație de algoritmi - a fost suficient pentru a crește contrastul imaginii și a găsi tranzițiile de la alb la negru și invers. Acest lucru a făcut posibilă identificarea limitelor literelor și a formei acestora, după care a fost posibilă determinarea fiecărei litere comparând-o cu mostrele pregătite anterior.

Construirea de biblioteci open source, cum ar fiOpenCV a deschis ușa pentru a experimenta cu imagini arbitrare. După forma marginilor detectate ale obiectului, computerul a putut înțelege unde sunt reprezentate o persoană, un ochi uman, o pasăre, o mașină - sistemele de viziune computerizată au depășit granițele recunoașterii textului.

Au apărut camerele de securitate care dădeau semnaldacă în cadru apărea o persoană. Aplicațiile cu viziune computerizată s-au instalat în telefoanele mobile: identificarea prin față, amprentă, retină sau scaner de coduri QR au fost de mult timp caracteristici comune. Și acum, nu un algoritm primitiv pentru compararea cu un eșantion este responsabil pentru înțelegerea a ceea ce este descris, ci o rețea neuronală antrenată folosind tehnologia de învățare automată.

De ce vederea computerizată este mai bună decât vederea umană

Primul și evident avantaj al CV-ului este multgamă mai largă de percepție. Viziunea computerizată, spre deosebire de privirea noastră, nu se limitează la spectrul vizibil. Principalul lucru este că senzorul este capabil să creeze o imagine pentru prelucrare ulterioară și care este sursa acestei imagini - o cameră termică, lidar, cameră video, unitate de raze X, ultrasunete sau aparat RMN - nu contează.

Al doilea avantaj al sistemelor de viziune computerizată estelipsa unui factor uman. Nu obosesc, nu sunt distrași, nu vor să doarmă, au vedere la 360 de grade. Informațiile necesare pot fi solicitate din arhivă pentru revizuire.

În plus, în procesul de învățare, rețeaua neuronalăpoate dezvălui conexiuni care nu sunt evidente pentru percepția umană. De exemplu, sistemul analizează imagini ale organelor interne umane și își formează o idee despre cum ar trebui să arate. Deci, este posibil să se determine nu numai tipul de organ, ci și gradul de abatere de la normă - în special, pentru a detecta o tumoare care nu este diagnosticată prin alte metode.

Cum viziunea computerizată schimbă modul în care vedem lumea

Tehnologia vizualizării computerizate acumEle sunt utilizate în medicină pentru detectarea tumorilor canceroase, în industrie pentru controlul asamblajelor în faza de producție și în automobile ca sisteme suplimentare de securitate. Nu ezităm să folosim viziunea computerizată pentru a debloca dispozitivul și, de obicei, înjurăm camerele de pe drumuri care dau amenzi.

Viziunea computerizată schimbă chiar și percepția asupra sportului- sistemele automate de urmărire controlează camerele de difuzare, ajută la rezolvarea momentelor controversate - dacă mingea a rămas pe terenul de tenis sau dacă a trecut linia porții, dacă a existat o încălcare sau o poziție de offside.

Înregistrările sunt păstrate cu ajutorul viziunii computerizateaglomerarea vehiculelor. Sistemul monitorizează câte roți din spate ale camionului sunt în contact cu suprafața drumului, cât de mult sunt deformate anvelopele și calculează sarcina utilă a vehiculului. Mai rămâne doar să recunoașteți plăcuța de înmatriculare și să faceți o intrare în baza de date.

Viziunea computerizată este de neînlocuit în depozitcontabilitate. Funcționează astfel: scanerul citește codul de bare de pe cutia cu produsul și introduce informațiile în baza de date. Mai mult, nu este necesar să scanați fiecare cutie - este mult mai convenabil să citiți codurile QR din toate cutiile de pe palet simultan.

Sistemele de procesare continuă să evoluezetexte - în sistemele moderne de gestionare a documentelor, o scanare a unui acord sau a unei facturi este descărcată ca document PDF, dar datorită viziunii computerizate, poate fi căutată, clasificată sau copiată.

O zonă separată este integrarea computeruluiviziune și tehnologie spațială. În agricultură, starea culturii este monitorizată cu ajutorul sateliților, Ministerul Situațiilor de Urgență monitorizează apariția incendiilor și inundațiilor. Google a folosit imaginile din satelit pentru a utiliza vederea computerizată pentru a identifica și a cartografi toate clădirile din Africa - de la piguri săpate pe un deal de pe malul râului până la clădiri înalte.

Sunt necesare tehnologii de viziune computerizată pentrucrearea realității augmentate - datorită recunoașterii punctelor de referință este posibilă încorporarea corectă a imaginii sintetizate în cadru și combinarea spațiilor reale și virtuale. De exemplu, într-o aplicație pentru montarea de la distanță a bijuteriilor, o cameră a smartphone-ului citește poziția mâinii utilizatorului, construiește un model și îi adaugă inelul selectat. Măștile 3D deja cunoscute de pe Instagram sunt și una dintre manifestările vederii computerizate în combinație cu VR/AR.

Câștigând popularitate și foarte specializateaplicațiile care oferă informații despre un copac dintr-o fotografie a unei frunze îi ajută pe culegătorii de ciuperci să afle dacă au primit un trofeu comestibil, iar colecționarii pot obține rapid informații despre o monedă îndreptând pur și simplu o cameră de pe smartphone spre ea.

Care sunt dezavantajele sistemelor de viziune computerizată

Sistemele de viziune computerizată sunt extrem de sensibilela resursele hardware. Cu cât rezoluția senzorilor externi este mai mare și cu cât este mai mare puterea de calcul, cu atât procesul de recunoaștere este mai fiabil și mai precis. Acest lucru poate fi văzut în exemplul tehnologiilor de recunoaștere a feței pentru deblocarea telefoanelor mobile. Acum un deceniu, acest lucru necesita o iluminare bună și o distanță bine definită față de față. Astăzi telefonul recunoaște proprietarul chiar și noaptea.

Un alt dezavantaj al CV-ului căruia i se poate atribui„Durerile de creștere” - erori în clasificarea obiectelor similare. De exemplu, o persoană poate distinge cu ușurință o maimuță de un cangur și o șopârlă de un crocodil, dar pentru un computer nu este atât de ușor cu ipostaze similare și anumite unghiuri de fotografiere.

O altă limitare a vederii computerizate esteprocesul de luare a deciziilor. O mașină premium modernă poate vedea mai departe decât o persoană: nu are puncte moarte, nu împiedică întunericul pe timp de noapte sau ceață, poate detecta apropierea unui obiect prin radiația sa termică. Dar într-o situație reală pe drum, o persoană este totuși mai bună la a lua decizii ținând cont de situația actuală. Și pentru a crește siguranța, pilotul automat trebuie să monitorizeze nu numai situația traficului, ci și propriul șofer.

În lumea viziunii artificiale, identificarea este una dintre celeprocese de bază, care ridică imediat multe întrebări legate de confidențialitate și datele personale. Prin urmare, este necesar să se țină cont de cerințele legale și de restricțiile etice asociate cu însuși faptul evaluării de către un computer a acțiunilor umane și de posibilele consecințe ale deciziilor luate de algoritmi. Subiectul amenzilor scrise greșit este o confirmare clară a acestui lucru.

Ce ne rezervă viitorul

Una dintre cele mai comune povești de groazăasociat cu viziunea computerizată – imaginea unui „lagăr de concentrare digital”, control total, de care este imposibil să te ascunzi. Sistemele de viziune computerizată ale viitorului vor putea controla nu numai mișcările, ci și intențiile: încruntarea înseamnă trist, a privi în jur înseamnă a planifica ceva. Filmele de succes distopice fantastice adaugă, de asemenea, fobii și negativitate în așteptarea unor astfel de viitor.

Scenariilor le place să-și gâdile nervii, speriendu-i pe alții noitehnologii. În practică, lumea de astăzi este „transparentă” pentru tehnologiile de control. Dar avantajele introducerii viziunii computerizate vor permite pe viitor să nu vă faceți griji pentru multe lucruri de rutină. De exemplu, cel mai probabil vom uita de casele de marcat din supermarketuri - sistemul in sine te identifica la intrare, controleaza ce pui in cos, calculeaza costul la iesire si debiteaza fondurile din cont. Datorită viziunii computerizate, va fi posibilă redirecționarea rapidă a fluxurilor de trafic pentru a evita blocajele, iar traficul în general va deveni mai sigur.

Viziunea computerizată este tehnologia viitoruluicare deja ne afectează viețile. Este profund integrat în lumea modernă și îi folosim capacitățile în fiecare zi. Dar suntem încă la începutul drumului, unde trebuie nu numai să rezolvăm problemele tehnice ale creșterii puterii de calcul, ci și să învățăm să trăim într-o nouă realitate. Pentru a face acest lucru, va trebui să învingi fobiile și să vină cu o legislație care să împiedice tehnologia să scape de sub control.

Citeste mai mult:

Priviți imaginile a două galaxii care se fuzionează, luate la 9 ani una dintre ele

Elon Musk: Starship poate ridica de 1.000 de ori mai multă marfă decât alte rachete

Materia întunecată inversează particulele obișnuite și umple universul