A szöveg, a VR és a drónok meghatározása: hogyan szünteti meg a számítógépes látás a rutint, de fenyegeti az adatokat

Hogyan kezdődött az egész

Ahhoz, hogy megtanítsa a számítógépet „látásra”, először egy érzékelőre van szüksége, amely olvas

információkat a környező térből, és képpé alakítja. A második komponens egy program a kép feldolgozására.

A nyomtatott szöveg tökéletes tesztnek bizonyultaz algoritmusok első generációját jelenti - elég volt a kép kontrasztjának növelése és a fehérről feketére való átmenet megtalálása és fordítva. Ez lehetővé tette a betűk határvonalának és alakjának azonosítását, majd az egyes betűk meghatározását a korábban elkészített mintákkal való összehasonlítással.

Nyílt forráskódú könyvtárak építése, mint plAz OpenCV megnyitotta az ajtót a tetszőleges képekkel való kísérletezés előtt. Az objektum észlelt éleinek alakja alapján a számítógép meg tudta érteni, hol van ábrázolva egy ember, egy emberi szem, egy madár, egy autó – a számítógépes látórendszerek túlléptek a szövegfelismerés határain.

Biztonsági kamerák jelentek meg, jelezveha egy személy megjelent a keretben. A számítógépes látással rendelkező alkalmazások megtelepedtek a mobiltelefonokban: az arc-, ujjlenyomat-, retina- vagy QR-kód-leolvasó általi azonosítás régóta általános jellemző. És most nem egy mintával való összehasonlítás primitív algoritmusa a felelős azért, hogy megértsük, mi az ábrázolt, hanem egy neurális hálózat, amelyet gépi tanulási technológiával képeztek ki.

Miért jobb a számítógépes látás, mint az emberi látás?

Az önéletrajz első és nyilvánvaló előnye sokaz érzékelés szélesebb köre. A számítógépes látás a mi tekintetünkkel ellentétben nem korlátozódik a látható spektrumra. A lényeg az, hogy a szenzor képes képet készíteni a további feldolgozáshoz, és hogy ennek a képnek mi a forrása - hőkamera, lidar, videokamera, röntgen, ultrahang vagy MRI készülék - nem mindegy.

A számítógépes látórendszerek második előnye azemberi tényező hiánya. Nem fáradnak el, nem zavarják a figyelmüket, nem akarnak aludni, 360 fokos rálátásuk van. A szükséges információkat az archívumból lehet kérni az újbóli megtekintéshez.

Emellett a tanulási folyamatban a neurális hálózatolyan összefüggéseket tárhat fel, amelyek az emberi felfogás számára nem nyilvánvalóak. Például a rendszer elemzi az emberi belső szervek képeit, és képet alkot arról, hogyan nézzenek ki. Így nemcsak a szerv típusa, hanem a normától való eltérés mértéke is meghatározható - különösen olyan daganat kimutatása, amelyet más módszerekkel nem diagnosztizáltak.

Hogyan változtatja meg a számítógépes látás a világról alkotott képünket

Számítógépes látás technológia mostAz orvostudományban rákos daganatok kimutatására, az iparban a gyártási szakaszban az összeszerelés ellenőrzésére és az autókban kiegészítő biztonsági rendszerként használják. Nyugodtan használjuk a számítógépes látást a készülék feloldásához, és az utakon a kamerákra szitkozódunk, amelyek bírságot szabnak ki.

A számítógépes látás még a sportról alkotott felfogást is megváltoztatja- automatikus nyomkövető rendszerek vezérlik a közvetítő kamerákat, segítik a vitás pillanatok rendezését - hogy a labda a teniszpályán belül maradt-e, vagy átlépte-e a gólvonalat, volt-e szabálysértés vagy leshelyzet.

A nyilvántartásokat számítógépes látás segítségével vezetjüka járművek zsúfoltsága. A rendszer figyeli, hogy a teherautó hány hátsó kereke érintkezik az útfelülettel, mennyire deformálódnak a gumiabroncsok, és kiszámítja a jármű hasznos terhelését. Nincs más hátra, mint felismerni a rendszámot és bejegyzést tenni az adatbázisba.

A számítógépes látás pótolhatatlan a raktárbankönyvelés. Ez így működik: a szkenner beolvassa a termékkel együtt lévő dobozon lévő vonalkódot, és beírja az információt az adatbázisba. Sőt, nem szükséges minden dobozt beszkennelni - sokkal kényelmesebb, ha a raklapon lévő összes dobozból egyszerre QR-kódot olvashat ki.

A feldolgozó rendszerek folyamatosan fejlődnekszövegek - a modern dokumentumkezelő rendszerekben a szerződés vagy számla szkennelt példánya PDF dokumentumként töltődik le, de a számítógépes látásnak köszönhetően kereshet, osztályozhat vagy másolhat rajta szöveget.

Külön terület a számítógép integrációjalátás és űrtechnológia. A mezőgazdaságban műholdak segítségével figyelik a termés állapotát, a rendkívüli helyzetek minisztériuma pedig a tüzek és árvizek előfordulását. A Google műholdképeket használt arra, hogy számítógépes látásmódot használva azonosítsa és térképezze fel Afrikában az összes épületet – a folyóparti dombon ásott ásóktól a sokemeletes épületekig.

Számítógépes látástechnológiákra van szükségkiterjesztett valóság létrehozása - a referenciapontok felismerésének köszönhetően lehetséges a szintetizált kép helyes beágyazása a keretbe, valamint a valós és a virtuális terek kombinálása. Például egy távoli ékszerillesztő alkalmazásban az okostelefon kamerája leolvassa a felhasználó kezének helyzetét, összeállít egy modellt, és hozzáadja a kiválasztott gyűrűt. Az Instagramon már ismert 3D-s maszkok a számítógépes látás egyik megnyilvánulása a VR / AR kombinációjával.

Egyre népszerűbb és nagyon specializálódottAz alkalmazások, amelyek egy levél fényképéről adnak ki információkat egy fáról, segítenek a gombászoknak kideríteni, hogy kaptak-e ehető trófeát, a gyűjtők pedig gyorsan tájékozódhatnak egy érméről, ha egyszerűen ráirányítják az okostelefon kameráját.

Melyek a számítógépes látórendszerek hátrányai

A számítógépes látórendszerek rendkívül érzékenyekhardver erőforrásokhoz. Minél nagyobb a külső érzékelők felbontása és minél nagyobb a számítási teljesítmény, annál megbízhatóbb és pontosabb a felismerési folyamat. Ez látható a mobiltelefonok feloldására szolgáló arcfelismerő technológiák példáján. Egy évtizeddel ezelőtt ehhez jó megvilágításra és az arctól való jól meghatározott távolságra volt szükség. Ma a telefon még éjszaka is felismeri a tulajdonost.

Az önéletrajz másik hátránya, aminek betudható"Növekedési fájdalmak" - hibák a hasonló tárgyak osztályozásában. Például az ember könnyen meg tudja különböztetni a majmot a kengurutól, a gyíkot a krokodiltól, de a számítógép számára ez nem olyan egyszerű hasonló pózokkal és bizonyos lövésszögekkel.

A számítógépes látás másik korlátja azdöntéshozatali folyamat. Egy modern prémium autó messzebbre lát, mint az ember: nincs holtfoltja, nem áll az éjszakai sötétség vagy a köd útjába, hősugárzásával képes érzékelni egy tárgy közeledését. De egy valós helyzetben az úton az ember még mindig jobban tud dönteni, figyelembe véve az aktuális helyzetet. A biztonság növelése érdekében pedig a robotpilótának nem csak a forgalmi helyzetet kell figyelnie, hanem a saját vezetőjét is.

A gépi látás világában az azonosítás az egyikalapvető folyamatokat, ami azonnal számos kérdést vet fel az adatvédelemmel és a személyes adatokkal kapcsolatban. Ezért figyelembe kell venni azokat a törvényi követelményeket és etikai korlátozásokat, amelyek az emberi cselekedeteket értékelő számítógép tényéhez és az algoritmusok által hozott döntések lehetséges következményeihez kapcsolódnak. A tévesen írt bírságok témája ennek egyértelmű megerősítése.

Mit tartogat számunkra a jövő

Az egyik leggyakoribb horror történetszámítógépes látással kapcsolatos - a "digitális koncentrációs tábor" képe, a teljes kontroll, amely elől lehetetlen elbújni. A jövő számítógépes látórendszerei nemcsak a mozdulatokat, hanem a szándékokat is képesek lesznek irányítani: a homlokráncolás szomorúságot, a körbenézés azt jelenti, hogy tervez valamit. A fantasztikus disztópikus kasszasikerek fóbiákat és negativitást is adnak az ilyen jövőkre való tekintettel.

A forgatókönyvírók előszeretettel csiklandozzák idegeiket, ijesztgetve az újakattechnológiákat. A gyakorlatban a világ ma „átlátszó” az irányítási technológiák tekintetében. De a számítógépes látás bevezetésének előnyei lehetővé teszik, hogy a jövőben ne aggódjon sok rutin dolog miatt. Például nagy valószínűséggel megfeledkezünk a szupermarketek pénztárgépeiről – a rendszer maga azonosítja Önt a bejáratnál, ellenőrzi, hogy mit tesz a kosárba, kiszámolja a költségeket a kilépéskor, és levonja a pénzt a számláról. A számítógépes látásnak köszönhetően lehetővé válik a forgalom gyors átirányítása a forgalmi dugók elkerülése érdekében, és általában véve biztonságosabbá válik a közlekedés.

A számítógépes látás a jövő technológiájaami már kihat az életünkre. Mélyen beépült a modern világba, és minden nap használjuk a képességeit. De még mindig az út elején járunk, ahol nemcsak a számítási teljesítmény növelésének technikai kérdéseit kell megoldanunk, hanem meg kell tanulnunk élni egy új valóságban. Ehhez le kell győznie a fóbiákat, és olyan jogszabályokat kell kidolgoznia, amelyek megakadályozzák, hogy a technológia kikerüljön az irányítás alól.

Olvass tovább:

Nézzen meg képeket két összeolvadó galaxisról, 9 év különbséggel

Elon Musk: A csillaghajó 1000-szer több rakományt képes felemelni, mint más rakéták

A sötét anyag megfordítja a közönséges részecskéket, és kitölti az univerzumot