Vedci z Cornell University vyvinuli rozhranie EchoSpeech na rozpoznávanie tichej reči.
Okuliare EchoSpeech sú vybavené dvojicou mikrofónov areproduktory, ktoré sú menšie ako guma na konci ceruzky a nepoužívajte fotoaparát. Prístroj vysiela a zachytáva akustické vlny, ktoré naznačujú zmeny v dynamike svalov tváre a úst. Algoritmus hlbokého učenia analyzuje tieto profily ozveny v reálnom čase s presnosťou približne 95 %.
Ako funguje EchoSpeech. Obrázok: Ruidong Zhang a kol.
Prijaté dáta sa prenášajú cez Bluetooth dov reálnom čase na smartfóne, sú spracované a uložené lokálne v zariadení. Vývojári uvádzajú, že školenie EchoSpeechu pre konkrétneho používateľa trvá niekoľko minút.
Pre ľudí, ktorí nevedia hovoriť, môže byť táto technológia tichej reči skvelým hlasovým syntetizátorom. Pacientom môže vrátiť ich hlas.
Ruidong Zhang, spoluautor vývoja
Väčšina tichých technológií rozpoznávania rečisú obmedzené na vybranú množinu preddefinovaných príkazov a vyžadujú, aby sa používateľ a osoba, s ktorou hovoria, pozerali do fotoaparátu alebo ho nosili. To výrazne komplikuje možnosť použitia takýchto zariadení. Veľký dátový tok navyše vyžaduje spracovanie v cloude, čo porušuje súkromie používateľov.
V súčasnej podobe môže EchoSpeechpoužívať na komunikáciu s ostatnými prostredníctvom smartfónu na miestach, kde je hovorenie nepohodlné alebo nevhodné, napríklad v hlučnej reštaurácii alebo tichej knižnici. Rozhranie tichej reči je možné spárovať aj so stylusom a dizajnovým softvérom, ako je CAD, čím sa prakticky eliminuje potreba klávesnice a myši, dodávajú vývojári.
Čítaj viac:
Vedci prišli na povahu zvláštnych rádiových signálov z planéty podobnej Zemi
Nad Talianskom sa rozhorela červená svätožiara. Teraz bola vysvetlená jeho povaha
Webb našiel najstaršiu čiernu dieru vo vesmíre