Inteligentny dyktafon wykorzystuje sztuczną inteligencję do transkrypcji nagrań

Chińscy programiści stworzyli cyfrowy dyktafon, który łączy się ze sztuczną inteligencją

automatyczna transkrypcja dźwięku.

Stosunkowo niedawno pojawiło się oprogramowanieOprogramowanie do transkrypcji mowy ludzkiej z plików audio i wideo. Mobvoi poszedł dalej i wykorzystał sztuczną inteligencję do stworzenia inteligentnego cyfrowego dyktafonu AI Recorder, który automatycznie konwertuje dźwięk na tekst.

Samo urządzenie waży 20 g, nagrywa dźwięk na 16 GBpamięć wewnętrzną za pośrednictwem dwóch mikrofonów, które współpracują z algorytmem redukcji szumów, aby znacznie zredukować szumy tła. Pliki zapisywane są w formacie OGG lub MP3.

AI Recorder jest dostarczany z roczną darmową aplikacjąsubskrybując usługę transkrypcji audio na tekst, która obecnie obsługuje język angielski i chiński, ale z czasem zostanie dodanych więcej języków. Autorzy opracowania zauważają, że zastosowanie podejścia do transkrypcji opartego na sztucznej inteligencji zapewnia dokładność na poziomie 94%. Jednocześnie w tekście automatycznie generowane są słowa kluczowe i akapity.

Czytaj więcej

Wyjaśnił, w jaki sposób wszechświat odbija się w pobliżu czarnych dziur

Masowe zatrucia i nowe wersje śmierci cywilizacji: jak zmieniła się nasza wiedza o Majach

Zmiany orbity Ziemi przyczyniły się do powstania złożonego życia na planecie