Kā viss sākās
Lai iemācītu datoram “redzēt”, vispirms ir nepieciešams sensors, kas nolasa
Iespiests teksts izrādījās ideāls pārbaudījumspirmās paaudzes algoritmu statīvs - pietika, lai palielinātu attēla kontrastu un atrastu pārejas no balta uz melnu un otrādi. Tas ļāva identificēt burtu robežas un to formu, pēc kā varēja noteikt katru burtu, salīdzinot to ar iepriekš sagatavotiem paraugiem.
Atvērtā pirmkoda bibliotēku izveide, piemēram,OpenCV atvēra durvis eksperimentiem ar patvaļīgiem attēliem. Pēc objekta noteikto seju formas dators varēja saprast, kur attēlots cilvēks, cilvēka acs, putns, automašīna - datorredzes sistēmas izgāja ārpus teksta atpazīšanas robežām.
Parādījās novērošanas kameras, kas deva signālu,ja kadrā parādījās cilvēks. Mobilajos tālruņos iedzīvojušās lietojumprogrammas ar datorredzi: identifikācija pēc sejas, pirkstu nospiedumu, tīklenes vai QR koda skenera jau sen kļuvušas par pazīstamām funkcijām. Un tagad, lai saprastu, kas ir attēlots, atbildīgs nav primitīvs modeļu salīdzināšanas algoritms, bet gan neironu tīkls, kas apmācīts, izmantojot mašīnmācīšanās tehnoloģiju.
Kāpēc datora redze ir labāka par cilvēka redzi?
Pirmā un acīmredzamā CV priekšrocība ir daudzplašāks uztveres diapazons. Datorredze, atšķirībā no mūsu acīm, neaprobežojas tikai ar redzamo spektru. Galvenais, lai sensors spēj izveidot attēlu tālākai apstrādei, un tam, kas ir šī attēla avots – termovizors, lidars, videokamera, rentgena aparāts, ultraskaņas aparāts vai MRI – nav nozīmes.
Otra datorredzes sistēmu priekšrocība ircilvēciskā faktora trūkums. Viņi nenogurst, nav apjucis, nevēlas gulēt, viņiem ir 360 grādu skats. Nepieciešamo informāciju var pieprasīt no arhīva atkārtotai apskatei.
Turklāt mācību procesā neironu tīklsvar atklāt sakarības, kas cilvēka uztverei nav acīmredzamas. Piemēram, sistēma analizē cilvēka iekšējo orgānu attēlus un veido priekšstatu par to, kā tiem vajadzētu izskatīties. Tādā veidā ir iespējams noteikt ne tikai orgāna veidu, bet arī novirzes pakāpi no normas - jo īpaši atklāt audzēju, kas nav diagnosticēts ar citām metodēm.
Kā datora redze maina veidu, kā mēs redzam pasauli
Datorredzes tehnoloģijas tagadizmanto medicīnā vēža audzēju noteikšanai, rūpniecībā, lai kontrolētu montāžu ražošanas stadijā un automašīnās kā papildu drošības sistēmas. Mēs nevilcināmies izmantot datorredzi, lai atbloķētu ierīci, un parasti lamājam kameras uz ceļiem, par kurām tiek uzlikti naudas sodi.
Datorredze pat maina priekšstatu par sportu- automātiskās izsekošanas sistēmas kontrolē apraides kameras, palīdz atrisināt strīdīgos jautājumus - vai bumba palika tenisa kortā, vai tā šķērsoja vārtu līniju, vai bija pārkāpums vai offside pozīcija.
Grāmatvedība tiek veikta izmantojot datorredzisatiksmes sastrēgumi. Sistēma kontrolē, cik kravas automašīnas aizmugurējie riteņi saskaras ar ceļa segumu, cik deformētas ir riepas, un aprēķina transportlīdzekļa kravnesības masu. Atliek tikai atpazīt numura zīmi un veikt ierakstu datubāzē.
Datorredze ir neaizstājama noliktavāgrāmatvedība. Tas darbojas šādi: skeneris nolasa svītrkodu uz izstrādājuma kastes un ievada informāciju datu bāzē. Turklāt nav nepieciešams skenēt katru kastīti - daudz ērtāk ir nolasīt QR kodus no visām paletes kastēm uzreiz.
Apstrādes sistēmas turpina attīstītiesteksti - mūsdienu darbplūsmas sistēmās līguma vai rēķina skenēts tiek lejupielādēts kā PDF dokuments, bet, pateicoties datorredzei, tajā var meklēt, klasificēt vai kopēt tekstu.
Atsevišķa joma ir datoru integrācijavīzija un kosmosa tehnoloģija. Lauksaimniecībā ar satelītu palīdzību viņi uzrauga ražas stāvokli, Ārkārtas situāciju ministrija uzrauga ugunsgrēku un plūdu rašanos. Google ir izmantojis datorredzi satelītattēlos, lai identificētu un kartētu visas Āfrikas struktūras, sākot no upes kalnā izraktajām zemnīcām un beidzot ar augstceltnēm.
Datorredzes tehnoloģijas ir nepieciešamaspaplašinātās realitātes izveide - tieši pateicoties atskaites punktu atpazīšanai, iespējams pareizi iegult sintezēto attēlu kadrā un apvienot reālās un virtuālās telpas. Piemēram, attālinātā juvelierizstrādājumu pielaikošanas aplikācijā viedtālruņa kamera nolasa lietotāja rokas stāvokli, izveido modeli un pievieno tam izvēlēto gredzenu. Jau pazīstamās 3D maskas Instagram ir arī viena no datorredzes izpausmēm kombinācijā ar VR / AR.
Iegūst popularitāti un ļoti specializējiesaplikācijas, kas sniedz informāciju par koku no lapas fotoattēla, palīdz sēņotājiem noskaidrot, vai viņi ieguvuši ēdamu trofeju, savukārt kolekcionāri var ātri iegūt informāciju par monētu, vienkārši pavēršot pret to viedtālruņa kameru.
Kādi ir datorredzes sistēmu trūkumi
Datorredzes sistēmas ir ārkārtīgi jutīgasaparatūras resursiem. Jo augstāka ir ārējo sensoru izšķirtspēja un lielāka skaitļošanas jauda, jo uzticamāks un precīzāks ir atpazīšanas process. To var redzēt piemērā par sejas atpazīšanas tehnoloģijām mobilo tālruņu atbloķēšanai. Pirms desmit gadiem tas prasīja labu apgaismojumu un kameras novietojumu stingri noteiktā attālumā no sejas. Šodien tālrunis atpazīst īpašnieku pat naktī.
Vēl viens CV trūkums, uz kuru var attiecināt"augšanas sāpes" - kļūdas līdzīgu objektu klasifikācijā. Piemēram, cilvēks var viegli atšķirt pērtiķi no ķengura, bet ķirzaku no krokodila, bet datoram ar līdzīgām pozām un noteiktiem šaušanas leņķiem tas nav tik vienkārši.
Vēl viens datorredzes ierobežojums ir −lēmumu pieņemšanas process. Mūsdienīgs premium auto redz tālāk par cilvēku: tam nav aklo zonu, netraucē nakts tumsa vai migla, tas spēj noteikt objekta tuvošanos pēc tā termiskā starojuma. Taču reālā situācijā uz ceļa cilvēks tomēr labāk spēj pieņemt lēmumus, ņemot vērā esošo situāciju. Un, lai palielinātu drošību, autopilotam ir jāuzrauga ne tikai satiksmes situācija, bet arī savs vadītājs.
Mašīnredzes pasaulē identifikācija ir viena nopamata procesi, kas uzreiz rada daudz jautājumu saistībā ar privātumu un personas datiem. Tāpēc ir jāņem vērā likuma prasības un ētiskie ierobežojumi, kas saistīti ar pašu to, ka dators izvērtē cilvēka darbības un algoritmu pieņemto lēmumu iespējamās sekas. Kļūdaini izrakstīto naudas sodu tēma ir skaidrs apstiprinājums tam.
Kas mūs sagaida nākotnē
Viens no populārākajiem šausmu stāstiemsaistīta ar datorredzi – "digitālās koncentrācijas nometnes" tēlu, totālu kontroli, no kuras nav iespējams noslēpties. Nākotnes datorredzes sistēmas spēs kontrolēt ne tikai kustības, bet arī nodomus: ja sarauc pieri, tas nozīmē, ka esi bēdīgs, ja skaties apkārt, tad kaut ko zīmē. Fantastiskie distopiskie grāvējfilmi arī papildina fobijas un negatīvismu, gaidot šādu nākotni.
Scenāristiem patīk pakutināt nervus, biedējot ar jaunutehnoloģijas. Praksē pasaule joprojām ir "caurspīdīga" kontroles tehnoloģijām šodien. Bet datorredzes ieviešanas priekšrocības ļaus nākotnē neuztraukties par daudzām ikdienas lietām. Piemēram, mēs, visticamāk, aizmirsīsim par kasēm lielveikalos - sistēma pati identificē jūs pie ieejas, kontrolē, ko tieši jūs ievietojat grozā, aprēķina izmaksas pie izejas un noraksta līdzekļus no paša konta. Pateicoties datorredzei, būs iespējams ātri novirzīt satiksmes plūsmas, lai izvairītos no sastrēgumiem, un satiksme kopumā kļūs drošāka.
Datorredze ir nākotnes tehnoloģija,kas jau ietekmē mūsu dzīvi. Tā ir dziļi integrēta mūsdienu pasaulē, un mēs izmantojam tās iespējas katru dienu. Taču mēs joprojām esam pašā ceļojuma sākumā, kur mums ir ne tikai jāatrisina tehniskie jautājumi par skaitļošanas jaudas palielināšanu, bet arī jāiemācās dzīvot jaunā realitātē. Lai to izdarītu, jums būs jāpārvar fobijas un jānāk klajā ar tiesību aktiem, kas neļaus tehnoloģijām izkļūt no kontroles.
Lasīt vairāk:
Apskatiet attēlus ar divām saplūstošām galaktikām, kas uzņemtas ar 9 gadu starpību
Elons Masks: Starship spēj pacelt 1000 reižu vairāk kravas nekā citas raķetes
Tumšā viela apvērš parastās daļiņas un piepilda Visumu