Deteksi dan Klasifikasi Bentuk Cyberbullying di Twitter Menggunakan Metode Support Vector Machine dan Naive Bayes

Share on facebook
Share on google
Share on twitter
Share on linkedin
Ilustrasi oleh iStock

Twitter merupakan salah satu media sosial yang sering digunakan karena memberikan banyak kemudahan bagi penggunanya. Twitter banyak digunakan oleh penggunanya untuk berbagi cerita, pengalaman, dan diskusi terkait suatu issue yang sedang ramai di masyarakat. Pengguna Twitter di Indonesia pada tahun 2019 tercatat sebanyak 6,43 juta pengguna. Tingkat pengguna Twitter yang tinggi juga memungkinkan untuk bebas berpendapat kepada siapa saja dan karena di sosial media penggunanya cenderung bersifat anonym, hal ini dapat memicu penggunanya tidak ragu dalam melakukan cyberbullying.

Faktor-faktor penyebab terjadinya kejahatan dapat dilihat dari dua sisi, yaitu faktor-faktor yang berasal dari dalam diri subjek (faktor internal) dan faktor yang muncul dari luar subjek (faktor eksternal). Faktor-faktor ini dalam kasus cyberbullying dapat mempengaruhi pelaku dalam menggunakan kata-kata yang berbeda dalam pesan, sehingga membentuk kategori cyberbullying yang berbeda satu sama lain. Bentuk-bentuk cyberbullying yang terjadi di twitter adalah flaming, denigration, dan body shaming. Flaming merupakan penggunaan pesan dengan istilah kasar dan vulgar, seperti mengumpat, bergosip, atau mengejek. Denigration adalah mengirim atau memposting gosip atau rumor tentang seseorang untuk merusak reputasinya (pencemaran nama baik). Body shaming adalah tindakan mengkritik atau mencela bentuk, ukuran, dan penampilan fisik orang lain.

Cyberbullying dapat menyerang seseorang tanpa memandang status atau agama mereka, para peneliti menemukan bahwa korban cyberbullying mengalami tingkat depresi yang lebih tinggi dari pada tindakan kekerasan verbal lainnya. Lalu apakah cyberbullying ini dapat dicegah?. Dalam riset ini digunakan algoritma machine learning dengan metode statistika untuk mendeteksi cyberbullying dan mengklasifikasikannya berdasarkan bentuk-bentuknya. Melalui riset ini harapannya mampu membuat para developer dan pengguna media sosial lebih sadar akan bentuk cyberbullying yang terkadang dilakukan tanpa disadari. Developer media sosial dapat mencegah cyberbullying dengan mengacu pada hasil riset ini sebagai kebijakan dalam pengembangan aplikasinya seperti, penambahan fitur deteksi kata dan fitur penyaringan untuk tweet (istilah untuk postingan di Twitter) yang mengarah pada cyberbullying, supaya hasil deteksi lebih akurat dapat dilakukan dengan pengklasifikasian berdasarkan bentuknya dan menggunakan metode statistika yang paling akurat.

Pengklasifikasikan bentuk cyberbullying di Twitter dalam riset ini menggunakan metode pengolahan data text mining dan text processing, sedangkan metode statistika yang digunakan adalah Naïve Bayes dan Support Vector Machine (SVM) dan membandingkannya berdasarkan akurasi klasifikasi. Pengidentifikasian kata-kata yang menjadi ciri khas setiap kategori cyberbullying bertujuan agar setiap kategori mudah dikenali oleh pengguna media sosial dan memudahkan untuk menghindari cyberbullying. Data yang digunakan dalam riset ini adalah 1000 tweet dengan tiga kategori berdasarkan jenis cyberbullying yaitu, flaming, denigration, dan body shaming. Periode pengambilan tweet adalah antara Desember 2019 dan Februari 2020.

Berdasarkan hasil dari riset diperoleh akurasi klasifikasi menggunakan metode Naïve Bayes sebesar 97,99% dan akurasi klasifikasi menggunakan metode Support Vector Machine (SVM) sebesar 99,60%. Hal ini berarti bahwa metode SVM lebih baik daripada metode Naïve Bayes dalam mengklasifikasikan bentuk-bentuk cyberbullying di Twitter.  Penulis  berharap, dengan bertambahnya bentuk-bentuk baru dari cyberbullying untuk dapat diidentifikasi dan diklasifikasikan maka kedepan perlu dikembangkan algoritma lain selain Naïve Bayes dan SVM yang didasarkan pada text mining dan text processing. Selain itu, pengembangan metode statistika yang terkait dengan pengidentifikasian dan pengklasifikasian text di Twitter yang didasarkan pada text mining dan text processing perlu dilakukan di masa mendatang.

Penulis: Dr. Nur Chamidah, S.Si., M.Si.

Informasi detail dari riset ini dapat dilihat pada tulisan kami di:

http://journal.uad.ac.id/index.php/JITEKI/article/view/21175

Nur Chamidah and Reiza Sahawaly, 2021. Comparison Support Vector Machine and Naive Bayes Methods for Classifying Cyberbullying in Twitter, Jurnal Ilmiah Teknik Elektro Komputer dan Informatika (JITEKI) Vol. 7, No. 2, August 2021, pp. 338-346 ISSN: 2338-3070, DOI: 10.26555/jiteki.v7i2.21175

Berita Terkait

newsunair

newsunair

https://t.me/pump_upp