Botovi će biti prisiljeni biti pristojni: za njih je razvijen antitoksični algoritam

Istraživači sa Sveučilišta Kalifornija u San Diegu razvili su algoritme za čišćenje govora

uvredljiv jezik koji generiraju online botovi.

Stručnjaci su prethodno isprobali različite pristupečišćenje govora od botova, no pokazalo se da su neučinkoviti. Navođenje otrovnih riječi izostavlja riječi koje se, kada se koriste izvan konteksta i same, čine normalnima, ali postaju uvredljive kada se koriste u kombinaciji s drugima. Pokušaj uklanjanja toksičnog govora iz podataka o obuci oduzima puno vremena i daleko je od pouzdanosti. Slični problemi nastaju pri razvoju neuralne mreže koja bi detektirala otrovni govor.

Sada stručnjaci za informatikus Kalifornijskog sveučilišta u San Diegu isprobali su novu metodu. Prvo su unijeli "štetne" znakove u unaprijed uvježban jezični model kako bi ga natjerali da generira toksičan sadržaj. Istraživači su potom istrenirali model koji su nazvali "zlim" da predvidi vjerojatnost da će sadržaj biti uvredljiv. Inženjeri su potom istrenirali "dobar model", koji je naučen izbjegavati sav sadržaj koji je visoko ocijenjen od strane "zlog modela".

Kao rezultat toga, autori razvoja potvrdili su da je njihov"dobar model" pokazao se učinkovitijim od najsuvremenijih metoda. Istraživači su predstavili svoj rad na AAAI Online konferenciji o umjetnoj inteligenciji.

Čitaj više:

Lovi se stoljećima: što znamo o planetu Vulkan pored Sunca

Fizičari su eksperimentalno potvrdili novi temeljni zakon za tekućine

Astronomi su pronašli izvor tajanstvenih radijskih praska koji dolaze iz svemira