Definizione di testo, VR e droni: come la computer vision elimina la routine, ma minaccia i dati

Come tutto è iniziato

Per insegnare a un computer a “vedere”, è necessario prima un sensore che legga

informazioni dallo spazio circostante e le trasforma in un'immagine. Il secondo componente è un programma per l'elaborazione di questa immagine.

Il testo stampato si è rivelato un test perfettorappresentare la prima generazione di algoritmi: è stato sufficiente aumentare il contrasto dell'immagine e trovare le transizioni dal bianco al nero e viceversa. Ciò ha permesso di identificare i confini delle lettere e la loro forma, dopodiché è stato possibile determinare ciascuna lettera confrontandola con campioni precedentemente preparati.

Creazione di librerie open source comeOpenCV ha aperto la porta alla sperimentazione di immagini arbitrarie. Dalla forma dei bordi identificati dell'oggetto, il computer potrebbe capire dove sono raffigurati una persona, un occhio umano, un uccello, un'auto: i sistemi di visione artificiale hanno superato i confini del riconoscimento del testo.

Le telecamere di sicurezza sono apparse, dando un segnalese una persona è apparsa nella cornice. Le applicazioni con visione artificiale si sono stabilite nei telefoni cellulari: l'identificazione tramite volto, impronta digitale, retina o scanner di codici QR sono state a lungo caratteristiche comuni. E ora, non un algoritmo primitivo per il confronto con un campione è responsabile della comprensione di ciò che viene rappresentato, ma una rete neurale addestrata utilizzando la tecnologia di apprendimento automatico.

Perché la visione artificiale è migliore della visione umana?

Il primo ed evidente vantaggio del CV è moltogamma più ampia di percezione. La computer vision, a differenza della nostra, non è limitata allo spettro visibile. La cosa principale è che il sensore è in grado di creare un'immagine per un'ulteriore elaborazione e quale sia la fonte di questa immagine - una termocamera, un lidar, una videocamera, una macchina a raggi X, una macchina a ultrasuoni o una risonanza magnetica - non ha importanza.

Il secondo vantaggio dei sistemi di visione artificiale èmancanza di un fattore umano. Non si stancano, non si distraggono, non hanno voglia di dormire, hanno una vista a 360 gradi. Le informazioni necessarie possono essere richieste all'archivio per la revisione.

Inoltre, nel processo di apprendimento, la rete neuralepuò rivelare connessioni che non sono ovvie alla percezione umana. Ad esempio, il sistema analizza le immagini degli organi interni umani e si fa un'idea di come dovrebbero apparire. Quindi è possibile determinare non solo il tipo di organo, ma anche il grado di deviazione dalla norma, in particolare per rilevare un tumore che non viene diagnosticato con altri metodi.

Come la computer vision sta cambiando il modo in cui vediamo il mondo

Tecnologia di visione artificiale oraSono utilizzati in medicina per il rilevamento di tumori cancerosi, nell'industria per il controllo dell'assemblaggio in fase di produzione e nelle automobili come sistemi di sicurezza aggiuntivi. Non esitiamo a utilizzare la visione artificiale per sbloccare il dispositivo e di solito imprechiamo contro le telecamere sulle strade che emettono multe.

La computer vision sta cambiando anche la percezione dello sport- i sistemi di tracciamento automatico controllano le telecamere di trasmissione, aiutano a risolvere i momenti controversi - se la palla è rimasta all'interno del campo da tennis o se ha attraversato la linea di porta, se c'è stata una violazione o una posizione di fuorigioco.

Le registrazioni vengono conservate con l'ausilio della visione artificialela congestione dei veicoli. Il sistema monitora quante ruote posteriori del camion sono a contatto con la superficie stradale, quanto sono deformati i pneumatici e calcola il carico utile del veicolo. Non resta che riconoscere la targa ed effettuare una registrazione nel database.

La computer vision è indispensabile in magazzinocontabilità. Funziona così: lo scanner legge il codice a barre sulla scatola con il prodotto e inserisce le informazioni nel database. Inoltre, non è necessario scansionare ogni scatola: è molto più comodo leggere i codici QR da tutte le scatole sul pallet contemporaneamente.

I sistemi di elaborazione continuano ad evolversitesti - nei moderni sistemi di gestione documentale, una scansione di un contratto o di una fattura viene caricata come documento PDF, ma grazie alla visione artificiale è possibile cercare, classificare o copiare il testo su di esso.

Un'area separata è l'integrazione del computervisione e tecnologia spaziale. In agricoltura, lo stato del raccolto viene monitorato tramite satelliti, il Ministero delle situazioni di emergenza monitora il verificarsi di incendi e inondazioni. Google ha utilizzato le immagini satellitari per utilizzare la visione artificiale per identificare e mappare tutte le strutture in Africa, dai rifugi scavati in una collina sulla riva del fiume ai grattacieli.

Le tecnologie di visione artificiale sono necessarie percreazione di realtà aumentata - è grazie al riconoscimento di punti di riferimento che è possibile incorporare correttamente l'immagine sintetizzata nella cornice e combinare spazi reali e virtuali. Ad esempio, in un'applicazione per il montaggio a distanza di gioielli, la fotocamera di uno smartphone legge la posizione della mano dell'utente, costruisce un modello e vi aggiunge l'anello selezionato. Le già note maschere 3D su Instagram sono anche una delle manifestazioni della computer vision in combinazione con VR/AR.

Guadagnando popolarità e altamente specializzatole applicazioni che forniscono informazioni su un albero da una fotografia di una foglia aiutano i raccoglitori di funghi a scoprire se hanno ottenuto un trofeo commestibile e i collezionisti possono ottenere rapidamente informazioni su una moneta semplicemente puntando la fotocamera di uno smartphone su di essa.

Quali sono gli svantaggi dei sistemi di visione artificiale

I sistemi di visione artificiale sono estremamente sensibilialle risorse hardware. Maggiore è la risoluzione dei sensori esterni e maggiore è la potenza di calcolo, più affidabile e preciso è il processo di riconoscimento. Questo può essere visto nell'esempio delle tecnologie di riconoscimento facciale per sbloccare i telefoni cellulari. Un decennio fa, ciò richiedeva una buona illuminazione e una distanza ben definita dal viso. Oggi il telefono riconosce il proprietario anche di notte.

Un altro svantaggio del CV che può essere attribuito a"Dolori della crescita" - errori nella classificazione di oggetti simili. Ad esempio, una persona può facilmente distinguere una scimmia da un canguro e una lucertola da un coccodrillo, ma per un computer non è così facile con pose simili e determinati angoli di ripresa.

Un altro limite della visione artificiale èprocesso decisionale. Una moderna auto premium può vedere più lontano di una persona: non ha punti ciechi, non ostacola l'oscurità di notte o la nebbia, può rilevare l'avvicinamento di un oggetto tramite la sua radiazione termica. Ma in una situazione reale sulla strada, una persona è ancora più brava a prendere decisioni tenendo conto della situazione attuale. E per aumentare la sicurezza, il pilota automatico deve monitorare non solo la situazione del traffico, ma anche il proprio conducente.

Nel mondo della visione artificiale, l'identificazione è una delleprocessi di base, che solleva immediatamente molte domande relative alla privacy e ai dati personali. Pertanto, è necessario tenere conto dei requisiti legali e dei vincoli etici associati al fatto stesso della valutazione da parte di un computer delle azioni umane e delle possibili conseguenze delle decisioni prese dagli algoritmi. Il tema delle multe scritte per errore ne è una chiara conferma.

Cosa ci riserva il futuro

Una delle storie dell'orrore più comuniassociato alla visione artificiale - l'immagine di un "campo di concentramento digitale", controllo totale da cui è impossibile nascondersi. I sistemi di visione artificiale del futuro saranno in grado di controllare non solo i movimenti, ma anche le intenzioni: accigliato significa triste, guardarsi intorno significa pianificare qualcosa. I fantastici blockbuster distopici aggiungono anche fobie e negatività in previsione di tali futuri.

Gli sceneggiatori amano solleticare i loro nervi, spaventandone di nuovitecnologie. In pratica, il mondo di oggi è "trasparente" per le tecnologie di controllo. Ma i vantaggi dell'introduzione della visione artificiale consentiranno in futuro di non preoccuparsi di molte cose di routine. Ad esempio, molto probabilmente ci dimenticheremo delle casse nei supermercati: il sistema stesso ti identifica all'ingresso, controlla ciò che metti nel carrello, calcola il costo all'uscita e addebita i fondi dal conto stesso. Grazie alla computer vision sarà possibile reindirizzare rapidamente i flussi di traffico per evitare ingorghi e la circolazione in generale diventerà più sicura.

La computer vision è la tecnologia del futuroche sta già influenzando le nostre vite. È profondamente integrato nel mondo moderno e usiamo le sue capacità ogni giorno. Ma siamo ancora all'inizio del percorso, dove non dobbiamo solo risolvere i problemi tecnici dell'aumento della potenza di calcolo, ma anche imparare a vivere in una nuova realtà. Per fare ciò, dovrai sconfiggere le fobie e elaborare una legislazione che impedisca alla tecnologia di sfuggire al controllo.

Leggi di più:

Guarda le immagini di due galassie che si fondono, scattate a 9 anni di distanza

Elon Musk: l'astronave può sollevare 1.000 volte più carico di altri razzi

La materia oscura inverte le particelle ordinarie e riempie l'universo