Analisis regresi menjadi metode yang begitu populer dalam analisis data. Metode yang bertujuan menganalisis hubungan fungsional antar variabel ini, selain memiliki pendekatan parametrik dan nonparametrik, juga memiliki pendekatan semiparametrik. Meski tidak terdengar familiar untuk sebagian besar pengguna Statistika, pendekatan semiparametrik memberikan alternatif untuk data penelitian yang variabelnya menunjukkan bentuk pola tertentu; sekaligus tidak berpola. Tak heran jika jenis pendekatan ini sering disebut gabungan antara pendekatan parametrik dan nonparametrik.
Berbagai permasalahan yang diteliti umumnya memiliki karakteristik yang mengarah pada pendekatan semiparametrik. Salah satunya adalah masalah kriminalitas di Indonesia. Meski tidak dapat sepenuhnya dihindari, masalah ini masih dapat diminimalisir melalui prediksi kejadiannya. Berkaitan dengan prediksi persentase kejadian kriminal tersebut, hubungan antara persentase kejadian kriminal dan faktor-faktor yang mempengaruhinya menunjukkan pola gabungan parametrik dan nonparametrik. Bentuk parametrik ditunjukkan oleh hubungan antara persentase kejadian kriminal dan persentase penduduk. Hal tersebut terkait dengan fakta bahwa peningkatan jumlah penduduk berkontribusi terhadap peningkatan angka kriminalitas dengan tren yang meningkat setiap tahunnya. Sementara bentuk nonparametrik ditunjukkan oleh hubungan antara persentase insiden kriminal dan persentase penduduk yang menganggur, serta hubungan antara persentase kejadian kriminal dan persentase penduduk miskin. Baik penduduk yang menganggur, maupun penduduk miskin, keduanya memiliki persentase yang berfluktuasi setiap tahun. Itulah mengapa penelitian ini difokuskan pada regresi semiparametrik yang menggunakan kombinasi estimator linier untuk komponen parametrik dan estimator Deret Fourier untuk komponen nonparametrik.
Berkaitan dengan penggunaan deret Fourier yang merupakan fungsi polinomial trigonometri, secara khusus penelitian ini membandingkan tiga bentuk deret Fourier dalam regresi semiparametrik untuk mendapatkan model terbaik. Berdasarkan konsep estimator deret Fourier yang mendeskripsikan dua kurva gelombang sinus dan cosinus, terdapat beberapa bentuk deret Fourier. Bentuk yang dimaksud adalah deret Fourier berbasis cosinus dan sinus, deret Fourier berbasis sinus, dan deret Fourier berbasis cosinus.
Dalam implementasinya, penelitian ini terdiri dari satu variabel respon dan tiga variabel prediktor. Variabel respon tersebut berupa persentase kejadian kriminal dari 34 provinsi di Indonesia. Sementara variabel prediktor pertama berupa persentase populasi sebagai komponen parametrik dan variabel prediktor kedua berupa persentase pengangguran sebagai komponen nonparametrik, serta variabel prediktor ketiga adalah persentase penduduk miskin sebagai komponen nonparametrik. Data dengan unit observasi 34 Provinsi di Indonesia tersebut bersumber dari Badan Pusat Statistik (BPS) dengan data tahun 2018 digunakan sebagai data training untuk mengestimasi kurva regresi, dan data tahun 2019 digunakan sebagai data testing untuk memprediksi persentase kejadian kriminalitas berdasarkan estimator deret Fourier yang terpilih. Berkaitan dengan hal itu, estimator regresi semiparametrik berbasis cosinus menjadi estimator deret Fourier yang terpilih dibandingkan estimator yang berbasis sinus, maupun cosinus dan sinus.
Berdasarkan analisis yang dilakukan, hasil estimasi dengan deret Fourier basis cosinus memiliki kriteria model yang parsimoni. Selain itu hasil estimasi dengan deret Fourier basis cosinus menghasilkan nilai Generalized Cross Validation (GCV) yang minimum sebesar 2,471, nilai Mean Square Error (MSE) yang minimum sebesar 0,0006, dan nilai koefisien determinasi yang tinggi sebesar 77,545%. Hasil estimasi tersebut dapat digunakan untuk memprediksi persentase kejadian kriminal di Indonesia. Hasil prediksi dengan estimator deret Fourier berbasis cosinus yang bekerja pada data training memiliki nilai Mean Absolute Error (MAE) sebesar 0,02. Nilai MAE tersebut menunjukkan bahwa nilai prediksi persentase kejadian kriminal semakin mendekati nilai sesungguhnya. Hal ini secara keseluruhan menunjukkan bahwa model yang dihasilkan dengan pendekatan semiparametrik berdasarkan estimator deret Fourier sudah sesuai untuk memprediksi persentase kejadian kriminal di Indonesia.
Penulis: M. Fariz Fadillah Mardianto
Informasi detail dari riset ini dapat dilihat pada artikel ilmiah berikut :
Fourier Series Estimator in Semiparametric Regression to Predict Criminal Rate in Indonesia published in AIP Conference Proceedings, 2329, 060009 (2021). Author : Rini Kustianingsih (UIM), M. Fariz Fadillah Mardianto (UNAIR), Belindha Ayu Ardhani (UNAIR), Kuzairi (UIM), Amin Thohari (UNAIR), Raka Andriawan (UNAIR), dan Tony Yulianto (UIM) dengan link sebagai berikut :