Kornelio universiteto mokslininkai sukūrė „EchoSpeech“ sąsają, skirtą tyliai kalbai atpažinti.
EchoSpeech akiniai yra su mikrofonų pora irgarsiakalbius, kurie yra mažesni už pieštuko gale esantį trintuką ir nenaudoja fotoaparato. Prietaisas siunčia ir fiksuoja akustines bangas, kurios rodo veido raumenų ir burnos dinamikos pokyčius. Gilus mokymosi algoritmas realiu laiku analizuoja šiuos aido profilius maždaug 95% tikslumu.
Kaip veikia EchoSpeech. Vaizdas: Ruidong Zhang ir kt.
Gauti duomenys per Bluetooth perduodami įrealiuoju laiku išmaniajame telefone, apdorojami ir saugomi lokaliai įrenginyje. Kūrėjai praneša, kad „EchoSpeech“ tam tikram vartotojui apmokyti užtrunka kelias minutes.
Žmonėms, kurie negali kalbėti, ši tylios kalbos technologija gali būti puikus balso sintezatorius. Ji gali grąžinti pacientams balsą.
Ruidong Zhang, kūrimo bendraautorius
Dauguma tylios kalbos atpažinimo technologijųapsiriboja pasirinktu iš anksto nustatytų komandų rinkiniu ir reikalauja, kad vartotojas ir asmuo, su kuriuo jie kalba, pažvelgtų į fotoaparatą arba jį nešiotų. Tai labai apsunkina galimybę naudoti tokius įrenginius. Be to, didelį duomenų srautą reikia apdoroti debesyje, o tai pažeidžia vartotojo privatumą.
Dabartinė forma „EchoSpeech“ galinaudokite bendrauti su kitais per išmanųjį telefoną vietose, kur kalbėti nepatogu arba netinkama, pavyzdžiui, triukšmingame restorane ar ramioje bibliotekoje. Be to, tylios kalbos sąsaja gali būti suporuota su rašikliu ir projektavimo programine įranga, tokia kaip CAD, todėl beveik nereikia klaviatūros ir pelės, priduria kūrėjai.
Skaityti daugiau:
Mokslininkai išsiaiškino keistų radijo signalų iš planetos, panašios į Žemę, prigimtį
Virš Italijos įsiliepsnojo raudona aureolė. Dabar jo prigimtis paaiškinta
Webbas rado seniausią juodąją skylę visatoje