Boti budou nuceni být zdvořilí: byl pro ně vyvinut antitoxický algoritmus

Vědci z Kalifornské univerzity v San Diegu vyvinuli algoritmy pro čištění řeči

urážlivý jazyk generovaný online roboty.

Odborníci již dříve zkoušeli různé přístupyčištění řeči robotů, ale ukázalo se, že jsou neúčinné. Výpis toxických slov vynechává slova, která, když jsou použita mimo kontext a samotná, vypadají normálně, ale stávají se urážlivou, když jsou použita v kombinaci s jinými. Pokus o odstranění toxické řeči z trénovacích dat je časově náročný a zdaleka ne spolehlivý. Podobné problémy nastávají při vývoji neuronové sítě, která by detekovala toxickou řeč.

Nyní specialisté na informatikuz Kalifornské univerzity v San Diegu vyzkoušeli novou metodu. Nejprve vložili „škodlivé“ podněty do předem trénovaného jazykového modelu, aby jej přinutili generovat toxický obsah. Vědci poté vycvičili model, který nazvali „zlý“, aby předpověděl pravděpodobnost, že obsah bude urážlivý. Inženýři poté trénovali „dobrý model“, který byl vyučován tak, aby se vyhnul veškerému obsahu, který byl vysoce hodnocen „zlým modelem“.

Autoři vývoje ve výsledku potvrdili, že jejich„dobrý model“ se ukázal být účinnější než nejmodernější metody. Vědci prezentovali svou práci na online konferenci AAAI o umělé inteligenci.

Přečtěte si více:

Loví se po staletí: co víme o planetě Vulcan vedle Slunce

Fyzici experimentálně potvrdili nový základní zákon pro kapaliny

Astronomové našli zdroj záhadných rádiových výbuchů, které pocházejí z vesmíru