Дефиниция на текст, VR и дронове: как компютърното зрение премахва рутината, но заплашва данните

Как започна всичко

За да научите компютъра да "вижда", първо се нуждаете от сензор, който чете

информация от околното пространство и я превръща в образ.е програмата за обработка на това изображение.

Печатният текст се оказа идеален тестстойка за първото поколение алгоритми - беше достатъчно да се увеличи контрастът на изображението и да се намерят преходи от бяло към черно и обратно. Това даде възможност да се идентифицират границите на буквите и тяхната форма, след което беше възможно да се определи всяка буква, като се сравнява с предварително подготвени проби.

Създаване на библиотеки с отворен код катоOpenCV отвори вратата за експериментиране с произволни изображения. Въз основа на формата на откритите лица на обекта компютърът би могъл да разбере къде са изобразени човек, човешко око, птица, автомобил - системите за компютърно зрение надхвърлят границите на разпознаването на текст.

Появиха се камери за наблюдение, подаващи сигнал,ако човек се появи в кадъра. Приложенията с компютърно зрение се настаниха в мобилните телефони: идентифицирането по лице, пръстов отпечатък, ретина или скенер за QR кодове отдавна са станали познати функции. И сега за разбирането на изобразеното не е отговорен алгоритъм за примитивен модел за сравнение, а невронна мрежа, обучена с помощта на технологията за машинно обучение.

Защо компютърното зрение е по-добро от човешкото?

Първото и очевидно предимство на CV-то е многопо-широк обхват на възприятие. Компютърното зрение, за разлика от нашите очи, не е ограничено до видимия спектър. Основното е, че сензорът е в състояние да създаде изображение за по-нататъшна обработка и какъв е източникът на това изображение - термовизор, лидар, видеокамера, рентгенов апарат, ултразвуков апарат или ЯМР - няма значение.

Второто предимство на системите за компютърно зрение елипса на човешки фактор. Те не се уморяват, не се разсейват, не искат да спят, имат 360-градусов изглед. Необходимата информация може да бъде поискана от архива за повторен преглед.

Освен това, по време на процеса на обучение, невронната мрежаможе да разкрие връзки, които не са очевидни за човешкото възприятие. Например, системата анализира изображения на човешки вътрешни органи и формира представа как трябва да изглеждат. По този начин е възможно да се определи не само вида на органа, но и степента на отклонение от нормата - по-специално да се открие тумор, който не се диагностицира с други методи.

Как компютърното зрение променя начина, по който виждаме света

Компютърни технологии за зрение сегасе използват в медицината за откриване на ракови тумори, в индустрията за контрол на сглобяването на етапа на производство и в автомобилите като допълнителни системи за сигурност. Ние не се колебаем да използваме компютърно зрение, за да отключим устройствата си, и обикновено ругаем камерите за движение, които издават глоби.

Компютърното зрение дори променя възприятието за спорт- автоматичните системи за проследяване контролират предавателните камери, помагат за разрешаването на спорни въпроси - дали топката е останала в тенис корта или е прекосила гол линията, дали е имало нарушение или позиция в засада.

Счетоводството се извършва с помощта на компютърно зрениезадръстванията. Системата контролира колко от задните колела на камиона са в контакт с пътната настилка, колко деформирани са гумите и изчислява масата на полезния товар на автомобила. Остава само да разпознаете регистрационния номер и да направите запис в базата данни.

Компютърното зрение е незаменимо в складасчетоводство. Работи така: скенерът чете баркода на кутията на продукта и въвежда информацията в базата данни. Освен това не е необходимо да сканирате всяка кутия - много по-удобно е да четете QR кодове от всички кутии на палет наведнъж.

Системите за обработка продължават да се развиваттекстове - в съвременните системи за работни процеси сканиране на договор или фактура се изтегля като PDF документ, но благодарение на компютърното зрение можете да търсите, класифицирате или копирате текста върху него.

Отделна област е интеграцията на компютъравизия и космически технологии. В селското стопанство с помощта на сателити следят състоянието на реколтата, Министерството на извънредните ситуации следи за възникването на пожари и наводнения. Google използва компютърно зрение върху сателитни изображения, за да идентифицира и картографира всяка структура в Африка, от землянки, вкопани в хълм край реката, до високи сгради.

Компютърните технологии за зрение са необходими засъздаване на разширена реалност - благодарение на разпознаването на референтни точки е възможно правилно да се вгради синтезираното изображение в рамката и да се комбинират реални и виртуални пространства. Например, в приложение за дистанционно монтиране на бижута, камерата на смартфона чете позицията на ръката на потребителя, изгражда модел и добавя избрания пръстен към него. Познатите вече 3D маски в Instagram също са една от проявите на компютърното зрение в комбинация с VR/AR.

Набира популярност и високоспециализиранприложения, които предоставят информация за дърво от снимка на лист, помагат на берачите на гъби да разберат дали са получили ядлив трофей, а колекционерите могат бързо да получат информация за монета, като просто насочат камерата на смартфона към нея.

Какви са недостатъците на системите за компютърно зрение

Компютърните системи за зрение са изключително чувствителникъм хардуерни ресурси. Колкото по-висока е разделителната способност на външните сензори и по-голяма изчислителна мощност, толкова по-надежден и точен е процесът на разпознаване. Това може да се види на примера с технологиите за разпознаване на лица за отключване на мобилни телефони. Преди десет години това изискваше добро осветление и поставяне на камерата на строго определено разстояние от лицето. Днес телефонът разпознава собственика дори през нощта.

Другой недостаток CV, который можно отнести к „болки в растежа“ – грешки в класификацията на подобни обекти. Например, човек може лесно да различи маймуна от кенгуру и гущер от крокодил, но за компютър не е толкова лесно с подобни пози и определени ъгли на снимане.

Друго ограничение на компютърното зрение е −процес на вземане на решения. Съвременната първокласна кола може да вижда по-далеч от човек: няма слепи зони, тъмнината през нощта или мъглата не пречи, може да разпознае приближаването на обект по топлинното си излъчване. Но в реална ситуация на пътя човек все пак е по-добър във вземането на решения, като се вземе предвид текущата ситуация. И за да повиши безопасността, автопилотът трябва да следи не само пътната обстановка, но и собствения си водач.

В света на машинното зрение идентификацията е една отосновни процеси, което веднага повдига много въпроси, свързани с поверителността и личните данни. Следователно е необходимо да се вземат предвид законовите изисквания и етичните ограничения, свързани със самия факт, че компютърът оценява човешките действия и възможните последици от решенията, взети от алгоритми. Темата за погрешно издадените глоби е ярко потвърждение за това.

Какво ни очаква в бъдеще

Една от най-популярните истории на ужаситесвързано с компютърното зрение - образът на "цифров концлагер", тотален контрол, от който е невъзможно да се скрие. Компютърните системи за зрение на бъдещето ще могат да контролират не само движенията, но и намеренията: ако се намръщиш, това означава, че си тъжен, ако се огледаш, замисляш нещо. Фантастичните дистопични блокбъстъри също добавят фобии и негативизъм в очакване на подобно бъдеще.

Сценаристите обичат да гъделичкат нервите, плашейки с новитехнологии. На практика светът все още е „прозрачен“ за контрол върху технологиите днес. Но предимствата на въвеждането на компютърно зрение ще ви позволят да не се тревожите за много рутинни неща в бъдеще. Например, най-вероятно ще забравим за касите в супермаркетите - самата система ви идентифицира на входа, контролира какво точно поставяте в кошницата, изчислява цената на изхода и отписва средствата от самата сметка. Благодарение на компютърното зрение ще бъде възможно бързо да се пренасочват транспортните потоци, за да се избегнат задръствания и трафикът като цяло ще стане по-безопасен.

Компютърното зрение е технологията на бъдещето,което вече засяга живота ни. Той е дълбоко интегриран в съвременния свят и ние използваме неговите възможности всеки ден. Но все още сме в самото начало на пътуването, където трябва не само да решим техническите проблеми с увеличаването на изчислителната мощност, но и да се научим как да живеем в нова реалност. За да направите това, ще трябва да победите фобиите и да излезете със законодателство, което няма да позволи на технологията да излезе извън контрол.

Прочетете още:

Вижте снимки на две сливащи се галактики, направени с 9 години разлика

Илон Мъск: Starship може да вдигне 1000 пъти повече товари от другите ракети

Тъмната материя обръща обикновените частици и изпълва Вселената