Ako sa to všetko začalo
Aby ste naučili počítač „vidieť“, potrebujete najskôr senzor, ktorý číta
Vytlačený text sa ukázal ako dokonalý testpredstavuje prvú generáciu algoritmov - stačilo zvýšiť kontrast obrazu a nájsť prechody z bielej do čiernej a naopak. To umožnilo identifikovať hranice písmen a ich tvar, po ktorom bolo možné určiť každé písmeno porovnaním s predtým pripravenými vzorkami.
Budovanie open source knižníc ako naprOpenCV otvorilo dvere experimentovaniu s ľubovoľnými obrázkami. Podľa tvaru zistených hrán objektu mohol počítač pochopiť, kde je zobrazená osoba, ľudské oko, vták, auto - systémy počítačového videnia prekročili hranice rozpoznávania textu.
Objavili sa bezpečnostné kamery, ktoré dávali signálak sa v zábere objavila osoba. Aplikácie s počítačovým videním sa udomácnili v mobilných telefónoch: identifikácia podľa tváre, odtlačku prsta, sietnice alebo skenerom QR kódu je už dlho bežnými funkciami. A teraz nie primitívny algoritmus na porovnávanie so vzorkou je zodpovedný za pochopenie toho, čo je zobrazené, ale neurónová sieť trénovaná pomocou technológie strojového učenia.
Prečo je počítačové videnie lepšie ako ľudské
Prvou a zjavnou výhodou životopisu je veľaširší rozsah vnímania. Počítačové videnie sa na rozdiel od nášho pohľadu neobmedzuje len na viditeľné spektrum. Hlavná vec je, že snímač je schopný vytvoriť obraz na ďalšie spracovanie a nezáleží na tom, čo je zdrojom tohto obrazu - termokamera, lidar, videokamera, röntgen, ultrazvuk alebo MRI.
Druhou výhodou systémov počítačového videnia jenedostatok ľudského faktora. Neunavujú sa, nerozptyľujú, nechcú spať, majú 360-stupňový výhľad. Potrebné informácie si možno vyžiadať z archívu na opätovné nahliadnutie.
Okrem toho v procese učenia sa neurónová sieťdokáže odhaliť súvislosti, ktoré ľudskému vnímaniu nie sú zrejmé. Systém napríklad analyzuje obrazy ľudských vnútorných orgánov a vytvára predstavu o tom, ako by mali vyzerať. Takže je možné určiť nielen typ orgánu, ale aj stupeň odchýlky od normy - najmä odhaliť nádor, ktorý nie je diagnostikovaný inými metódami.
Ako počítačové videnie mení spôsob, akým vnímame svet
Technológia počítačového videnia terazPoužívajú sa v medicíne na detekciu rakovinových nádorov, v priemysle na kontrolu montáže vo fáze výroby a v automobiloch ako doplnkové bezpečnostné systémy. Na odomknutie zariadenia neváhame použiť počítačovú víziu a bežne nadávame na kamery na cestách, ktoré udeľujú pokuty.
Počítačové videnie mení dokonca aj vnímanie športu- automatické sledovacie systémy kontrolujú vysielacie kamery, pomáhajú utriediť kontroverzné momenty - či loptička zostala na tenisovom kurte alebo či prešla bránkovou čiarou, či došlo k priestupku alebo ofsajdovému postaveniu.
Záznamy sa vedú pomocou počítačového videniapreťaženie vozidiel. Systém sleduje, koľko zadných kolies nákladného vozidla je v kontakte s povrchom vozovky, ako veľmi sú zdeformované pneumatiky a vypočítava užitočné zaťaženie vozidla. Ostáva už len rozpoznať ŠPZ a urobiť záznam do databázy.
Počítačové videnie je v sklade nenahraditeľnéúčtovníctvo. Funguje to takto: skener načíta čiarový kód na škatuľke s produktom a vloží informácie do databázy. Navyše nie je potrebné skenovať každú krabicu - oveľa pohodlnejšie je načítať QR kódy zo všetkých krabíc na palete naraz.
Systémy spracovania sa neustále vyvíjajútexty - v moderných systémoch správy dokumentov sa sken zmluvy alebo faktúry stiahne ako PDF dokument, ale vďaka počítačovému videniu sa dá vyhľadávať, triediť alebo kopírovať.
Samostatnou oblasťou je integrácia počítačavízia a vesmírne technológie. V poľnohospodárstve sa stav úrody monitoruje pomocou satelitov, Ministerstvo pre mimoriadne situácie monitoruje výskyt požiarov a povodní. Google použil satelitné snímky na použitie počítačového videnia na identifikáciu a zmapovanie všetkých budov v Afrike – od zemľancov vykopaných v kopci na brehu rieky až po výškové budovy.
Technológie počítačového videnia sú potrebné natvorba rozšírenej reality - práve vďaka rozpoznaniu referenčných bodov je možné správne vložiť syntetizovaný obraz do rámčeka a kombinovať reálne a virtuálne priestory. Napríklad v aplikácii na diaľkové osadenie šperkov kamera smartfónu načíta polohu ruky používateľa, postaví model a pridá k nemu vybraný prsteň. Už známe 3D masky na Instagrame sú tiež jedným z prejavov počítačového videnia v kombinácii s VR / AR.
Získavanie popularity a vysoko špecializovanéaplikácie, ktoré poskytujú informácie o strome z fotografie listu, pomáhajú hubárom zistiť, či dostali jedlú trofej, a zberatelia môžu rýchlo získať informácie o minci jednoduchým namierením fotoaparátu smartfónu na ňu.
Aké sú nevýhody systémov počítačového videnia
Systémy počítačového videnia sú mimoriadne citlivéna hardvérové zdroje. Čím vyššie je rozlíšenie externých senzorov a čím väčší výpočtový výkon, tým je proces rozpoznávania spoľahlivejší a presnejší. Vidno to na príklade technológií rozpoznávania tváre na odomykanie mobilných telefónov. Pred desiatimi rokmi to vyžadovalo dobré osvetlenie a presne definovanú vzdialenosť od tváre. Dnes telefón rozpozná majiteľa aj v noci.
Ďalšia nevýhoda CV, ktorú možno pripísať"Rastúce bolesti" - chyby v klasifikácii podobných objektov. Napríklad, človek ľahko rozozná opicu od kengury a jaštericu od krokodíla, no pre počítač to s podobnými pózami a určitými uhlami streľby také jednoduché nie je.
Ďalším obmedzením počítačového videnia jeproces rozhodovania. Moderné prémiové auto vidí ďalej ako človek: nemá mŕtve uhly, neprekáža mu tma ani hmla, dokáže rozpoznať približovanie sa objektu svojim tepelným žiarením. Ale v reálnej situácii na ceste sa človek predsa len lepšie rozhoduje s prihliadnutím na momentálnu situáciu. A pre zvýšenie bezpečnosti musí autopilot sledovať nielen dopravnú situáciu, ale aj vlastného vodiča.
Vo svete strojového videnia je identifikácia jednou zzákladných procesov, čo okamžite vyvoláva množstvo otázok týkajúcich sa súkromia a osobných údajov. Preto je potrebné brať do úvahy zákonné požiadavky a etické obmedzenia spojené so samotnou skutočnosťou počítačového hodnotenia ľudského konania a možných dôsledkov rozhodnutí prijatých algoritmami. Téma omylom napísaných pokút je toho jasným potvrdením.
Čo nám prinesie budúcnosť
Jeden z najbežnejších hororových príbehovspojené s počítačovým videním – obraz „digitálneho koncentračného tábora“, totálna kontrola, pred ktorou sa nemožno skryť. Systémy počítačového videnia budúcnosti budú schopné ovládať nielen pohyby, ale aj zámery: mračiť sa znamená smutno, pozerať sa okolo znamená niečo plánovať. Fantastické dystopické trháky tiež pridávajú fóbie a negativitu v očakávaní takejto budúcnosti.
Scenáristi si radi šteklia nervy a strašia novýchtechnológií. V praxi je dnešný svet pre riadiace technológie „transparentný“. Výhody zavedenia počítačového videnia však v budúcnosti umožnia nestarať sa o veľa rutinných vecí. Napríklad na pokladne v supermarketoch s najväčšou pravdepodobnosťou zabudneme - systém vás sám identifikuje pri vstupe, kontroluje, čo vložíte do košíka, vypočíta náklady na výstupe a odpíše prostriedky z účtu. Vďaka počítačovému videniu bude možné rýchlo presmerovať dopravné toky, aby sa predišlo dopravným zápcham a premávka vo všeobecnosti bude bezpečnejšia.
Počítačové videnie je technológiou budúcnostiktorý už ovplyvňuje naše životy. Je hlboko integrovaný do moderného sveta a jeho schopnosti využívame každý deň. Stále sme ale na úplnom začiatku cesty, kde musíme riešiť nielen technické otázky zvyšovania výpočtového výkonu, ale aj naučiť sa žiť v novej realite. Aby ste to dosiahli, budete musieť poraziť fóbie a prísť s legislatívou, ktorá zabráni, aby sa technológia vymkla spod kontroly.
Čítaj viac:
Pozrite si obrázky dvoch splývajúcich galaxií, ktoré boli od seba vzdialené 9 rokov
Elon Musk: Starship dokáže zdvihnúť 1000-krát viac nákladu ako iné rakety
Temná hmota obracia bežné častice a napĺňa vesmír