AI se učí efektivněji nahrazením číselných štítků lidským hlasem

Vědci zjistili, že když se porovnávají neuronové sítě s různými trénovacími štítky, fungují lépe.

budou nahrané lidským hlasem spíše než jednoduchými binárními vstupy. 

Binární jazyk je kompaktní a přesný propřenos informací. Naproti tomu mluvená lidská řeč je více tonální a analogická. Protože čísla představují efektivní způsob digitalizace dat, programátoři při navrhování neuronové sítě zřídka používají jiné typy vstupů.

Jedno z nejběžnějších cvičení protestování nové metody strojového učení: výuka umělé inteligence rozpoznávat předměty nebo zvířata na fotografii. Autoři nové práce provedli experiment: vytvořili dvě nové neuronové sítě, které měly rozpoznat deset různých typů objektů v kolekci 50 tisíc fotografií. 

První systém umělé inteligence byl trénován tradičním způsobem: byla načtena datová tabulka s tisíci řádky, z nichž každý odpovídal jedné cvičné fotografii. 

A autoři nahráli tabulku do druhého systémuúdaje, jejichž řádky obsahovaly fotografii zvířete nebo předmětu a ve druhém sloupci byl zvukový soubor, ve kterém osoba vyslovuje název předmětu či zvířete. 

Výsledkem bylo, že první neuronová síť vytvořila digitálnívýznam předmětu, který jí byl ukázán, a druhý se snažil „vyprávět“, co viděla. Oba algoritmy se s úkolem vyrovnaly stejně efektivně a odpověděly správně v 92 % případů, poznamenávají autoři. 

Výsledky experimentu se však změnily, kdyžvědci snížili vzorek z 50 tisíc na 2,5 tisíce Poté klesla správnost odpovědí první AI na 35 % a u druhé, která byla trénována hlasem, klesla pouze na 70 %. 

Přečtěte si více:

Vědci se poprvé vrhli na nejhlubší potopenou loď

Byla vytvořena první přesná mapa světa. Co se děje s ostatními?

Objevil se bezdrátový systém, který pomáhá paralyzovat