A botok kénytelenek lesznek udvariaskodni: anti-toxikus algoritmust fejlesztettek ki számukra

A San Diego-i Kaliforniai Egyetem kutatói algoritmusokat fejlesztettek ki a beszéd megtisztítására

az online botok által generált sértő nyelvezet.

A szakértők korábban különböző megközelítéseket próbáltak kimegtisztította a botok beszédét, de hatástalannak bizonyultak. A mérgező szavak felsorolása kihagyja azokat a szavakat, amelyek kontextuson kívül és önmagukban normálisnak tűnnek, de másokkal együtt használva sértővé válnak. A mérgező beszéd eltávolítása a képzési adatokból időigényes és távolról sem megbízható. Hasonló problémák merülnek fel olyan neurális hálózat fejlesztésekor, amely észleli a toxikus beszédet.

Most számítástechnikai szakembereka San Diego-i Kaliforniai Egyetemen új módszert próbáltak ki. Először „káros” jeleket tápláltak be egy előre kiképzett nyelvi modellbe, hogy mérgező tartalom generálására kényszerítsék. A kutatók ezután kiképeztek egy általuk „gonosznak” nevezett modellt, hogy előre jelezzék, mekkora valószínűséggel lesz sértő a tartalom. A mérnökök ezután kiképezték a „jó modellt”, amelyet megtanítottak kerülni minden olyan tartalmat, amelyet a „gonosz modell” magasra értékel.

Ennek eredményeként a fejlesztés szerzői megerősítették, hogy az őa "jó modell" hatékonyabbnak bizonyult, mint a legmodernebb módszerek. A kutatók az AAAI Mesterséges Intelligenciával foglalkozó Online Konferencián mutatták be munkájukat.

Olvass tovább:

Évszázadok óta vadásznak rá: mit tudunk a Nap melletti Vulkán bolygóról

A fizikusok kísérletileg megerősítették a folyadékokra vonatkozó új alaptörvényt

A csillagászok megtalálták az űrből érkező titokzatos rádiókitörések forrását