Peneliti UI Kembangkan Pendeteksi Ujaran Kebencian di Twitter
Peneliti dari Fakultas Ilmu Komputer Universitas Indonesia (Fasilkom UI), Muhammad Okky Ibrohim dan Indra Budi memanfaatkan Artificial Intelligence (AI) untuk mendeteksi ujaran kebencian dan bahasa kasar yang di-cuit-kan oleh netizen Indonesia di Twitter.
Penelitian ini kelak dapat dimanfaatkan oleh Direktorat Tindak Pidana Siber Bareskrim Polri untuk investigasi kejahatan siber di Indonesia.
Hasil riset menunjukkan bahwa kombinasi fitur Word Unigram, Random Forest Decision Tree (RFDT), dan Label Power-set (LP) mampu medeteksi bahasa kasar dan ujaran kebencian yang terdapat di Twitter dengan akurasi 77,36 persen.
Seperti dilansir situs Medcom.id, Senin (30/11/2020), dari total 13.169 cuitan yang berhasil dikumpulkan dengan memanfaatkan Twitter Search API, tercatat sebanyak 7.608 cuitan adalah bukan ujaran kebencian, dan 5.561 cuitan adalah ujaran kebencian.
Menurut Okky, dalam risetnya ini, ujaran kebencian dikategorikan menjadi lima kategori, seperti agama, ras, fisik, gender atau orientasi seksual, dan umpatan lainnya. Pendeteksian juga mampu mengklasifikasikan target, kategori, dan level ujaran kebencian itu sendiri.
Ujaran kebencian diklasifikasikan pada tiga level. Pertama, weak hate speech yaitu level kata umpatan ditujukan pada individu tanpa unsur provokasi. Kedua, moderate hate speech adalah level umpatan yang ditujukan kepada kelompok tanpa provokasi. Ketiga, strong hate speech adalah level umpatan yang memprovokasi dan berpotensi membuka konflik.
“Penelitian kami berangkat dari maraknya ujaran kebencian dan penggunaan bahasa yang kasar pada media sosial, khususnya Twitter, yang sangat berpotensi menimbulkan konflik antarindividu maupun kelompok," terang Okky.
Tidak jarang pula, ujaran kebencian dengan menggunakan bahasa kasar dipakai untuk menyerang seseorang maupun kelompok.
"Saat ini, kami terus berupaya mengembangkan pemanfaatan AI untuk deteksi hate speech. Kami berharap, dengan adanya alat bantu teknologi, maka akan semakin mempermudah tim melakukan investigasi kejahatan siber," imbuhnya.
Dalam penelitiannya, kata Okky, baik definisi yang digunakan maupun panduan anotasi disusun berdasarkan buku bahasa sosial dan handbook ujaran kebencian, serta divalidasi oleh ahli dengan wawancara dan diskusi kelompok bersama staf Direktorat Tindak Pidana Siber Badan Reserse dan Kriminal Kepolisian Negara Republik Indonesia (Bareskrim Polri). Ditambah peran seorang linguis yang dilakukan untuk memvalidasi definisi ujaran kebencian secara tepat. (RM)