Testi paljasti: vihapuheen tunnistavia robotteja voi huijata helposti

Aapo Siippainen

Vihapuheen sekä laittomien ja loukkaavien kommenttien määrä verkkokeskustelussa on kasvanut niin suureksi, että niitä pyritään tunnistamaan tekoälyllä.

Aalto-yliopiston Secure Systems -tutkimusryhmä on kuitenkin löytänyt vihapuheentunnistimista suuria heikkouksia. Ryhmän mukaan käyttäjien on helppo kiertää vihapuhetta suitsivat robotit.

Tekoälyn on vaikea tunnistaa esimerkiksi kirjoitusvirhe, joka on tehty tahallisesti tai tahattomasti. Sama koskee myös huonoa kielioppia.

Ryhmä kokeili seitsemän tunnistamistyökalun tarkkuutta. Kaikki reputtivat testit. Välilyöntien poistaminen sanojen välistä osoittautui englanninkielisen sisällön manipuloinnissa tehokkaimmaksi.

– Lisäsimme vihapuheeksi tai loukkaavaksi määriteltyjen kommenttien sekaan kirjoitusvirheitä, muokkasimme sanojen rajoja tai lisäsimme joukkoon neutraaleja sanoja. Kaikkia keinoja yhdistelemällä saimme jopa Googlen kommenttien arvottamiseen käyttämän Perspective-työkalun sekaisin, kertoo Tommi Gröndahl, Aalto-yliopiston tohtorikoulutettava.

Tutkijat huomauttavat, että asiayhteys määrittää pitkälti sen, tulkitaanko yksittäinen kommentti vihaksi vai vain asiattomaksi tai mauttomaksi. Tutkijoiden mukaan pelkät koneelliset menetelmät eivät riitä vihapuheen tarkkaan tunnistamiseen.

– Ihmiset muuttavat toimintaansa ja alkavat kokeilla eri tapoja kirjoittaa, koska he haluavat välttää kiinnijäämistä. Ollakseen tehokas, tekoäly tarvitsee avukseen ihmisen tekemää tulkintaa, uskoo tutkimusryhmän johtaja, Aalto-yliopiston professori N. Asokan

Kommentoi

Mitä tunnetta artikkeli sinussa herättää? Ilmaisemalla tunteesi näet toisten reaktiot.

Tilaa uutiskirje

Kun tilaat uutiskirjeen, saat päivittäin sähköpostiisi tärkeimmät paikalliset uutiset. Uutiskirje lähetetään sähköpostiisi joka päivä kello 14.

Lomaketta suojaa reCAPTCHA, johon pätevät Googlen Tietosuoja ja Käyttöehdot.

Palvelut