Cómo todo empezó
Para enseñarle a una computadora a “ver”, primero necesita un sensor que lea
El texto impreso resultó ser una prueba perfectarepresentan la primera generación de algoritmos: fue suficiente para aumentar el contraste de la imagen y encontrar las transiciones de blanco a negro y viceversa. Esto permitió identificar los límites de las letras y su forma, luego de lo cual fue posible determinar cada letra comparándola con muestras previamente preparadas.
Construyendo bibliotecas de código abierto comoOpenCV ha abierto la puerta a experimentar con imágenes arbitrarias. Por la forma de los bordes detectados del objeto, la computadora podía entender dónde se representa a una persona, un ojo humano, un pájaro, un automóvil; los sistemas de visión por computadora iban más allá de los límites del reconocimiento de texto.
Aparecieron cámaras de seguridad, dando una señal.si una persona apareció en el marco. Las aplicaciones con visión por computadora se han asentado en los teléfonos móviles: la identificación por rostro, huella dactilar, retina o escáner de código QR han sido durante mucho tiempo características comunes. Y ahora, no un algoritmo primitivo para comparar con una muestra es responsable de comprender lo que se representa, sino una red neuronal entrenada con tecnología de aprendizaje automático.
Por qué la visión por computadora es mejor que la visión humana
La primera y obvia ventaja de CV es muchogama más amplia de percepción. La visión por computadora, a diferencia de nuestra mirada, no se limita al espectro visible. Lo principal es que el sensor puede crear una imagen para su posterior procesamiento, y cuál es la fuente de esta imagen: una cámara termográfica, lidar, cámara de video, unidad de rayos X, máquina de ultrasonido o resonancia magnética, no importa.
La segunda ventaja de los sistemas de visión por computadora esfalta de un factor humano. No se cansan, no se distraen, no quieren dormir, tienen una vista de 360 grados. La información necesaria se puede solicitar al archivo para su revisión.
Además, en el proceso de aprendizaje, la red neuronalpuede revelar conexiones que no son obvias para la percepción humana. Por ejemplo, el sistema analiza imágenes de órganos internos humanos y se forma una idea de cómo deberían verse. Por lo tanto, es posible determinar no solo el tipo de órgano, sino también el grado de desviación de la norma, en particular, para detectar un tumor que no se diagnostica con otros métodos.
Cómo la visión por computadora está cambiando la forma en que vemos el mundo
Tecnología de visión por computadora ahoraSe utilizan en medicina para la detección de tumores cancerosos, en la industria para el control de ensamblajes en la etapa de producción y en automóviles como sistemas de seguridad adicionales. No dudamos en utilizar la visión por computadora para desbloquear el dispositivo, y habitualmente insultamos a las cámaras en las carreteras que emiten multas.
La visión por computadora está cambiando incluso la percepción de los deportes- Los sistemas de seguimiento automático controlan las cámaras de transmisión y ayudan a resolver los momentos controvertidos: si la pelota permaneció dentro de la cancha de tenis o si cruzó la línea de gol, si hubo una infracción o una posición de fuera de juego.
Los registros se mantienen con la ayuda de la visión por computadora.la congestión de vehículos. El sistema monitorea cuántas ruedas traseras del camión están en contacto con la superficie de la carretera, cuánto están deformadas las llantas y calcula la carga útil del vehículo. Todo lo que queda es reconocer la matrícula y hacer una entrada en la base de datos.
La visión por computadora es insustituible en el almacéncontabilidad. Funciona así: el escáner lee el código de barras en la caja con el producto e ingresa la información en la base de datos. Además, no es necesario escanear todas las cajas; es mucho más conveniente leer los códigos QR de todas las cajas del palet a la vez.
Los sistemas de procesamiento continúan evolucionandoTextos: en los sistemas modernos de gestión de documentos, el escaneo de un contrato o factura se descarga como un documento PDF, pero gracias a la visión por computadora, se puede buscar, clasificar o copiar.
Un área separada es la integración de la computadoravisión y tecnología espacial. En agricultura, el estado del cultivo se monitorea mediante satélites, el Ministerio de Situaciones de Emergencia monitorea la ocurrencia de incendios e inundaciones. Google ha utilizado imágenes satelitales para usar la visión por computadora para identificar y mapear todos los edificios en África, desde piraguas excavados en una colina en la orilla del río hasta edificios de gran altura.
Las tecnologías de visión por computadora son necesarias paraCreación de realidad aumentada: es gracias al reconocimiento de puntos de referencia que es posible incrustar correctamente la imagen sintetizada en el marco y combinar espacios reales y virtuales. Por ejemplo, en una aplicación para la colocación remota de joyas, la cámara de un teléfono inteligente lee la posición de la mano del usuario, construye un modelo y le agrega el anillo seleccionado. Las ya conocidas máscaras 3D en Instagram también son una de las manifestaciones de la visión por computadora en combinación con VR / AR.
Ganando popularidad y altamente especializadoLas aplicaciones que brindan información sobre un árbol a partir de una fotografía de una hoja ayudan a los recolectores de hongos a averiguar si obtuvieron un trofeo comestible, y los recolectores pueden obtener información rápidamente sobre una moneda simplemente apuntándola con la cámara de un teléfono inteligente.
¿Cuáles son las desventajas de los sistemas de visión por computadora?
Los sistemas de visión por computadora son extremadamente sensiblesa los recursos de hardware. Cuanto mayor sea la resolución de los sensores externos y más potencia de cálculo, más fiable y preciso será el proceso de reconocimiento. Esto se puede ver en el ejemplo de tecnologías de reconocimiento facial para desbloquear teléfonos móviles. Hace una década, esto requería una buena iluminación y una distancia bien definida del rostro. Hoy en día, el teléfono reconoce al propietario incluso de noche.
Otra desventaja del CV que se puede atribuir a"Dolores de crecimiento": errores en la clasificación de objetos similares. Por ejemplo, una persona puede distinguir fácilmente un mono de un canguro y un lagarto de un cocodrilo, pero para una computadora no es tan fácil con poses similares y ciertos ángulos de disparo.
Otra limitación de la visión por computadora esproceso de toma de decisiones. Un automóvil premium moderno puede ver más lejos que una persona: no tiene puntos ciegos, no se interpone en la oscuridad por la noche o la niebla, puede detectar la aproximación de un objeto por su radiación térmica. Pero en una situación real en la carretera, una persona es aún mejor para tomar decisiones teniendo en cuenta la situación actual. Y para aumentar la seguridad, el piloto automático debe monitorear no solo la situación del tráfico, sino también a su propio conductor.
En el mundo de la visión artificial, la identificación es uno de losprocesos básicos, lo que inmediatamente plantea muchas preguntas relacionadas con la privacidad y los datos personales. Por lo tanto, es necesario tener en cuenta los requisitos legales y las restricciones éticas asociadas con el hecho mismo de la evaluación de las acciones humanas por parte de una computadora y las posibles consecuencias de las decisiones tomadas por algoritmos. El tema de las multas redactadas erróneamente es una clara confirmación de esto.
Lo que nos depara el futuro
Una de las historias de terror más comunes.asociado con la visión por computadora - la imagen de un "campo de concentración digital", control total, del cual es imposible esconderse. Los sistemas de visión por computadora del futuro podrán controlar no solo los movimientos, sino también las intenciones: fruncir el ceño significa tristeza, mirar alrededor significa planificar algo. Los fantásticos éxitos de taquilla distópicos también agregan fobias y negatividad en anticipación de tales futuros.
A los guionistas les encanta hacerles cosquillas en los nervios y asustar a los nuevostecnologías. En la práctica, el mundo actual es "transparente" para las tecnologías de control. Pero las ventajas de la introducción de la visión por computadora permitirán en el futuro no preocuparse por muchas cosas rutinarias. Por ejemplo, lo más probable es que nos olvidemos de las cajas registradoras en los supermercados: el sistema en sí lo identifica en la entrada, controla lo que pone en la canasta, calcula el costo a la salida y carga los fondos de la cuenta. Gracias a la visión por computadora, será posible redirigir rápidamente los flujos de tráfico para evitar atascos y el tráfico en general será más seguro.
La visión por computadora es la tecnología del futuroque ya está afectando nuestras vidas. Está profundamente integrado en el mundo moderno y usamos sus capacidades todos los días. Pero todavía estamos en el comienzo del camino, donde tenemos que no solo resolver los problemas técnicos del aumento de la potencia informática, sino también aprender a vivir en una nueva realidad. Para hacer esto, tendrá que vencer las fobias y elaborar una legislación que evite que la tecnología se salga de control.
Lee mas:
Mire imágenes de dos galaxias fusionadas, tomadas con 9 años de diferencia
Elon Musk: Starship puede levantar 1.000 veces más carga que otros cohetes
La materia oscura invierte las partículas ordinarias y llena el universo