Instagram Şimdi Troller ve Spam Gönderenlerle Savaşmak İçin AI Kullanıyor

Sosyal medyayı kullanmak nefret dolu konuşmalar ve rahatsız edici yorumlarla karşılaşma talihsiz riski ile birlikte gelir.

Arkasındaki şirketler sürekli nefret dolu konuşma ile mücadele için yeni yollar arıyor ve şimdi Instagram mantıklı bir aşamaya geçiyor: Yapay zeka.

Instagram, geçen sene, özet akışınızda görünebilecek belirli saldırgan kelimeleri otomatik olarak kaldırmanıza izin veren bir anahtar kelime filtresi geliştirdi.

Araç, “genellikle uygunsuz olarak bildirildi” sözcüklerini kaldırdı ve özel anahtar kelimeler ayarlamanıza izin verildi, ancak o sırada bazı uyarılarından bahsettik; Troller her zaman yeni saldırgan bir dille karşı karşıya kaldıklarından, nefret dolu yorumları mücadele etmek yorucu olabilir:

… troller, internet doğduğundan beri, yanlış yazılmış slurs’leri kullanarak ya da bazen tamamen yenilerini kullanarak filtreler arasında yol buluyorlardı.

Neyse ki, kendi özel anahtar kelimelerinizi ve cümlelerinizi ekleyebilirsiniz, ancak Instagram, ağı memnuniyetle karşılamak için sadece basit bir kelime filtresi yapmaktan fazlasını yapacaktır; Bigots, saldırgan veya rahatsız edici yorumları, özellikle saldırgan kelimeler kullanmadan söyleyebilir.

Bu yeni filtre, makine istihbaratını kullanarak bu uyarıları almaya çalışıyor.

Instagram, saldırgan konuşmanın bağlamını denemek ve anlamaya çalışmak için AI kullanıyor ve belirli anahtar kelimeleri tetikler bile olsa kötüye kullanımdan kurtuluyor.

Bu, şu anda yalnızca İngilizce olarak çalışsa da, nefret dolu yorumları mücadelenin kedi-fare doğasını hafifletmeye yardımcı olacaktır.

Kablolu, DeepText adlı AI sisteminin rahatsız edici dili tanımlayabileceği konusunda daha ayrıntılı bir ayrıntıya giriyor. Örneğin, “beyaz” kelimesinin bir renk veya başlık (White Sox, beyaz kar) gibi saldırgan olmayabileceğini anlayabilir, ancak “beyaz güç” pek çok kullanımda rahatsız edici olabilir.

Tabii ki, nefret söylemini tanımlamak daima karanlık olur (insanların hepsini tespit etmede o kadar da iyi değildir) ve yanlış pozitif risk söz konusudur.

Ne yaparsınız, nefret söylemini yalnızca belki de bir yanıt amacıyla alıntılarsanız ne olur?

Sözde homonyms veya farklı bağlamlarda farklı anlamlara sahip rahatsız edici kelimeler vardır.

Ancak AI, yapmayacağından sistemi zamanla daha akıllı hale getirmelidir.

Neyin rahatsız edici olduğuna karar veren bir robot beyin fikrinden hoşlanmıyorsanız, Instagram’ın ayarlarındaki yorumlar bölümünden kapatma seçeneğiniz vardır.

Instagram ayrıca Spam’i tanımlamak için DeepText’i kullanıyor, bu da umarım tamamen elimizden kayda değer bir şey olduğunu düşünüyor.