UNAIR NEWS – Dalam ilmu teknologi informasi, pencarian informasi berupa dokumen teks atau yang dikenal dengan istilah Information Retrieval (IR) merupakan proses pemisahan dokumen-dokumen yang dianggap relevan dari sekumpulan dokumen yang tersedia. Salah satu cara meningkatkan perfoma IR adalah dengan stemming. Yakni, cara mentransformasi kata-kata dalam sebuah dokumen teks ke kata dasarnya.
Proses stemming untuk bahasa satu berbeda dengan algoritma stemming bahasa yang lain. Seperti halnya bahasa Indonesia memiliki beberapa algoritma stemming. Hanya saja yang banyak dikenal adalah algoritma Tala dan Algoritma Nazhief & Andriani.
Berdasarkan masalah tersebut, Mohammad Ali Asy-Syakir mahasiswa Fakultas Sains dan Teknologi Universitas Airlangga (FST UNAIR) bersama dengan tim menciptakan aplikasi pembanding algoritma Tala dan Nazhief & Adriani menggunakan bahasa pemrograman python. Aplikasi tersebut diberi nama “Comparison of Indonesian Tala and Nazhief Adriani Stemming Algorithms Performance Using Python“.
Menurut Ali, sapaan akrabnya, aplikasi tersebut bertujuan untuk membandingkan algoritma Tala dan Nazhief & Adriani. Selain itu, aplikasi tersebut juga untuk mengimplementasikannya.
“Mengimplementasikan dan membandingkan metode Tala dan Nazhief Adriani menggunakan bahasa pemrograman python dengan hasil akhir berupa web app,” ujar mahasiswa tingkat akhir tersebut.
Dalam prosesnya, pemilihan pemrograman python bukanlah tanpa sebab. Hal itu karena menurut Ali, library pendukung banyak dijumpai di bahasa pemrograman python sehingga lebih mudah dalam pengaplikasiannya.
Selain itu, Ali juga menyampaikan bahwa tahap implementasi menjadi salah satu kesulitannya. Hal tersebut karena ditahap tersebut membutuhkan waktu cukup lama untuk mempelajari kedua algoritma stemming.
Ali juga mengungkapkan, dari hasil uji coba diketahui bahwa kedua metode memiliki kelebihan masing-masing. Yakni, algoritma Tala memiliki waktu lebih cepat dalam prosesnya, sedangkan yang Nazhief memiliki akurasi yang lebih tinggi.
“Kedua metode memiliki kelebihan masing-masing. Yang Tala lebih cepat dalam waktu pemrosesannya, sedangkan yang Nazhief, dia (Algoritma Nazhief & Andriani, Red) memiliki akurasi yang lebih tinggi dibandingkan Tala,” tutur mahasiswa Sistem Informasi tersebut.
Dengan adanya aplikasi tersebut, Ali berharap ke depannya terdapat studi lanjutan yang dapat mengembangkan algoritma yang lebih efektif dalam melakukan stemming baik dari sisi waktu pemrosesan maupun di akurasinya.
Tak hanya itu, Aplikasi tersebut berhasil mengantarkan Ali mendapatkan Silver Award dalam ajang Management & Science University on Idea Regeneration Expo 2019 (MSU iREX 2019), pada 16-17 Desember 2019, di Chancellor Hall, Management & Science University, Malaysia. (*)
Penulis : Asthesia Dhea Cantika
Editor : Binti Q. Masruroh