Botlar kibar olmaya zorlanacak: Onlar için toksik olmayan bir algoritma geliştirildi

San Diego'daki California Üniversitesi'ndeki araştırmacılar, konuşmayı temizlemek için algoritmalar geliştirdiler.

çevrimiçi botlar tarafından oluşturulan saldırgan dil.

Uzmanlar daha önce farklı yaklaşımlar denemişti.botların konuşmasını temizliyor, ancak etkisiz oldukları ortaya çıktı. Zehirli kelimelerin listelenmesi, bağlam dışında ve tek başına kullanıldığında normal görünen, ancak başkalarıyla birlikte kullanıldığında rahatsız edici hale gelen kelimeleri dışarıda bırakır. Zehirli konuşmaları eğitim verilerinden çıkarmaya çalışmak zaman alıcıdır ve güvenilir olmaktan uzaktır. Zehirli konuşmayı tespit edecek bir sinir ağı geliştirilirken de benzer sorunlar ortaya çıkıyor.

Artık bilgisayar bilimi uzmanlarıSan Diego'daki California Üniversitesi'nden bilim insanları yeni bir yöntem denedi. İlk olarak, önceden eğitilmiş bir dil modelini toksik içerik oluşturmaya zorlamak için "zararlı" ipuçlarını beslediler. Araştırmacılar daha sonra içeriğin rahatsız edici olma ihtimalini tahmin etmek için "kötü" adını verdikleri bir modeli eğittiler. Mühendisler daha sonra "kötü model" tarafından yüksek puan alan tüm içeriklerden kaçınmayı öğreten "iyi modeli" eğitti.

Sonuç olarak, geliştirmenin yazarları,"iyi model"in en modern yöntemlerden daha etkili olduğu kanıtlandı. Araştırmacılar çalışmalarını AAAI Çevrimiçi Yapay Zeka Konferansı'nda sundular.

Daha fazla oku:

Yüzyıllardır avlanıyor: Güneş'in yanındaki Vulcan gezegeni hakkında ne biliyoruz?

Fizikçiler, sıvılar için yeni bir temel yasayı deneysel olarak onayladılar

Gökbilimciler uzaydan gelen gizemli radyo patlamalarının kaynağını buldular