Nova visão de máquina sem lentes reduz cálculos e economiza energia

Pesquisadores chineses substituíram as lentes usadas em sistemas clássicos de visão computacional por

máscaras ópticas localizadas próximas ao sensorImagens. O estudo mostrou que as máscaras ópticas podem substituir efetivamente as camadas da rede neural convolucional. Ao mesmo tempo, a eficiência energética do novo sistema é duas vezes superior à do clássico.

Os pesquisadores observam que, paraA visão computacional agora tende a usar redes neurais convolucionais. Essa tecnologia oferece a qualidade necessária, mas a enorme quantidade de dados envolvida no processamento de imagens exige equipamentos que consomem muita energia elétrica e, além disso, os cálculos nem sempre podem ser realizados "in loco".

Abordagem tradicional e nova. Imagem: Wanxin Shi et al., Light: Science & Formulários

A tecnologia proposta por cientistas em um novo trabalho,usa uma máscara passiva inserida no caminho da luz da imagem para realizar operações de convolução no campo óptico. Essa abordagem, como observam os cientistas, resolve o problema do processamento de sinais de luz incoerentes e de banda larga em cenas naturais. Além disso, no novo sistema, o canal óptico, o processamento de imagens e a rede interna interagem de forma a reduzir a quantidade de computação e o consumo de energia em todo o sistema, dizem os autores do desenvolvimento.

Os pesquisadores testaram seu desenvolvimento parareconhecimento e classificação de dígitos manuscritos. Os resultados mostraram que ao usar um único kernel de convolução, a precisão de reconhecimento pode chegar a 93,47%. Quando a operação de convolução multicanal é implementada colocando vários kernels na máscara em paralelo, a precisão da classificação aumenta para 97,21%. Ao mesmo tempo, em comparação com as linhas tradicionais de visão de máquina, o sistema consome metade da energia.

Imagem: Wanxin Shi et al., Light: Science & Formulários

Os pesquisadores também observam que a tecnologiapode ser usado para reconhecimento de rosto, no entanto, as próprias imagens de rosto não são armazenadas ou processadas no sistema, o que aumenta a confidencialidade dos dados e protege a privacidade e a privacidade.

Os desenvolvedores acreditam que a nova arquitetura terá muitas aplicações potenciais em muitos cenários do mundo real, como direção autônoma, casas inteligentes e segurança inteligente.

Consulte Mais informação

Veja o drone "silencioso" com uma nova geração de propulsão iônica

Urano é um planeta muito estranho. Explicamos por que os astrônomos querem enviar uma sonda para ele

Cientistas propõem revisar os fundamentos da física quântica e mostrar onde eles não funcionam