AI-bril leerde om "lippen te lezen" zonder een camera te gebruiken

Onderzoekers van Cornell University hebben een EchoSpeech-interface ontwikkeld voor het herkennen van zachte spraak.

waarbij gebruik wordt gemaakt van akoestische perceptie enkunstmatige intelligentie voor continue herkenning van maximaal 31 stemloze commando's op basis van lip- en mondbewegingen. De informatieverwerking vindt lokaal op de smartphone plaats, waardoor de vertrouwelijkheid van de gegevens wordt gegarandeerd.

EchoSpeech-brillen zijn uitgerust met een paar microfoons enluidsprekers die kleiner zijn dan de gum aan het uiteinde van een potlood en geen camera gebruiken. Het apparaat verzendt en pikt akoestische golven op die veranderingen in de dynamiek van de gezichtsspieren en de mond aangeven. Een deep learning-algoritme analyseert deze echoprofielen in realtime met een nauwkeurigheid van ongeveer 95%. 

Hoe EchoSpeech werkt. Afbeelding: Ruidong Zhang et al.

De ontvangen gegevens worden via Bluetooth verzonden naarrealtime op een smartphone, lokaal verwerkt en opgeslagen op het apparaat. De ontwikkelaars melden dat EchoSpeech slechts een paar minuten nodig heeft om te trainen voor een specifieke gebruiker.

Voor mensen die niet kunnen praten, kan deze stille spraaktechnologie een geweldige stemsynthesizer zijn. Ze kan patiënten hun stem teruggeven.

Ruidong Zhang, mede-ontwikkelaar

De meeste stille spraakherkenningstechnologieënzijn beperkt tot een selecte reeks vooraf gedefinieerde opdrachten en vereisen dat de gebruiker en zijn gesprekspartner naar een camera kijken of deze dragen. Dit bemoeilijkt het gebruik van dergelijke apparaten aanzienlijk. Bovendien vereist een grote stroom aan gegevens verwerking in de cloud, wat de privacy van gebruikers schendt.

In zijn huidige vorm kan EchoSpeech dat zijnGebruik hem om via de smartphone met anderen te communiceren op plaatsen waar spraak ongemakkelijk of ongepast is, zoals een luidruchtig restaurant of een stille bibliotheek. De stille spraakinterface kan ook worden gecombineerd met een stylus en ontwerpsoftware zoals CAD, waardoor de noodzaak voor een toetsenbord en muis vrijwel wordt geëlimineerd, voegen de ontwikkelaars toe.

Lees verder:

Wetenschappers hebben de aard ontdekt van vreemde radiosignalen van een planeet die op de aarde lijkt

Een rode halo lichtte op boven Italië. Nu is de aard ervan uitgelegd

Webb heeft het oudste zwarte gat in het universum gevonden