Apa itu Model Regresi Logistik Ordinal Nonparametrik?

Share on facebook
Share on google
Share on twitter
Share on linkedin
Ilustrasi oleh sillyplace.net

Regresi dalam statistika adalah salah satu metode untuk menentukan hubungan sebab-akibat antara suatu variabel dengan variabel yang lain. Variabel “penyebab” biasa disebut dengan beberapa istilah seperti misalnya variabel prediktor, variabel penjelas, variabel eksplanatori, variabel independen, variabel bebas, atau variabel X. Sedangkan variabel “terkena akibat” dikenal sebagai variabel yang dipengaruhi dan biasa disebut dengan variabel respon, variabel terikat, variabel dependen, variabel tak bebas atau variabel Y.

Regresi logistik merupakan salah satu jenis regresi yang menghubungkan antara satu atau beberapa variabel prediktor dengan variabel respon yang berupa kategori. Dalam banyak kasus, kita menjumpai variabel respon yang ingin dianalisis mempunyai tipe data kualitatif (kategori). Jika variabel respon memiliki dua kategori (biner) maka dinamakan regresi logistik biner. Data biner dapat dituliskan secara nominal (contoh ya dan tidak) dan secara numerik (contoh 1 dan 0). Representasi angka 1 dan 0 bukan bermaksud menunjukkan angka numerik dalam arti yang sebenarnya, melainkan hanya bentuk representasi dalam membedakan dua nilai yang mungkin. Pada data biner, angka 1 dapat berarti ya dan angka 0 berarti tidak. Selanjutnya, jika variabel respon memiliki lebih dari dua kategori dan berskala ordinal maka dinamakan regresi logistik ordinal. Skala ordinal adalah skala pengukuran berupa data tingkatan atau rangking. Misalkan variabel kepuasan pelayanan dapat diklasifikasikan menjadi ‘sangat puas’, ‘puas’, ‘tidak puas’, dan ‘sangat tidak puas’. Pada model regresi logistik ordinal, variabel respon Y berupa data ordinal yang memiliki k kategori dengan variabel prediktornya dapat berupa variabel kategori, kontinu atau campuran keduanya.

Regresi logistik banyak diterapkan di berbagai bidang misalnya sosial, ekonomi maupun bidang  kesehatan. Sebagai contoh di bidang ekonomi, misalkan ingin diketahui faktor-faktor apa saja yang menjadi penyebab sebuah kredit bank berisiko gagal bayar (macet) dengan variabel responnya dikategorikan 0 jika tidak gagal bayar (lancar) dan 1 jika gagal bayar (macet), sedangkan contoh di bidang kesehatan yaitu misalkan ingin diketahui faktor-faktor apa saja yang menyebabkan risiko seseorang terkena penyakit Diabetes dengan variabel responnya dikategorikan 0 jika tidak terkena Diabetes dan 1 jika terkena Diabetes.  

Dalam perkembangannya, terdapat 3 jenis model pendekatan regresi yang dilakukan oleh para peneliti, yaitu pendekatan regresi parametrik, nonparametrik, dan semiparametrik. Regresi parametrik mengasumsikan bahwa bentuk kurva regresi diketahui berdasarkan teori, informasi sebelumnya, atau sumber- sumber lain yang dapat memberi pengetahuan secara terperinci. Jika asumsi bentuk kurva parametrik ini tidak terpenuhi, maka kurva regresi dapat diduga menggunakan model regresi nonparametrik. Pendekatan nonparametrik dilakukan berdasarkan pendekatan yang tidak terikat asumsi bentuk kurva regresi tertentu. Oleh karena itu, pendekatan model regresi nonparametrik lebih fleksibel dan obyektif karena membiarkan data sendiri yang akan mencari bentuk estimasi dari kurva regresinya tanpa harus dipengaruhi oleh faktor subyektifitas si peneliti dalam menentukan bentuk kurva regresinya.

Regresi logistik biner nonparametrik merupakan pengembangan dari model regresi logistik biner dengan pendekatan nonparametrik. Beberapa penelitian tentang regresi logistik biner nonparametrik telah dilakukan dengan tujuan untuk mengkaji estimasi parameter model regresi logistik biner nonparametrik menggunakan beberapa metode diantaranya yaitu metode Local Likelihood Estimation (LLE) berdasarkan algoritma local scoring, metode Local Likelihood Logit Estimation (LLLE) berdasarkan iterasi Newton Raphson, dan metode Generalized Additive Models (GAM) berdasarkan estimator lokal linier, penalized spline dan estimator polinomial lokal.

Dalam penelitian ini penulis mengembangkan model regresi logistik ordinal nonparametrik yang merupakan pengembangan dari model regresi logistik ordinal parametrik yaitu dengan pendekatan nonparametrik dan mengestimasi parameter model menggunakan metode Local Maximum Likelihood Estimation (LMLE) berdasarkan estimator lokal linier serta menyediakan algoritma untuk mengestimasi parameternya. penulis telah menunjukkan prosedur langkah demi langkah untuk mendapatkan estimasi parameter berdasarkan LMLE. Hasil turunan parsial pertama terhadap parameter yang akan diestimasi, penulis memperoleh fungsi yang nonlinear terhadap parameter model yang akan diestimasi sehingga diperlukan suatu metode numerik untuk memperoleh estimasi parameternya. Metode numerik yang digunakan adalah metode iterasi Newton-Raphson. Selain itu, dalam metode LMLE berdasarkan estimator lokal linier, terdapat parameter bandwidth yang harus ditentukan secara optimal. Salah satu metode penentuan bandwidth optimal adalah metode Cross Validation (CV) yang mana bandwidth optimal dicapai pada saat nilai CV minimum.  Hasil esimasi model selain dapat digunakan untuk kepentingan interpretasi juga dapat digunakan untuk menentukan ketepatan klasifikasi, sensitivitas dan spesifisitas. Sangat mudah untuk menerapkan prosedur yang sama yang disajikan dalam artikel ini untuk mengembangkan model lain berdasarkan distribusi yang berbeda atau jenis estimator yang lainnya.

Penulis: Dr. Nur Chamidah, M.Si

Informasi detil dari penelitian ini dapat dilihat pada tulisan kami di:

http://scik.org/index.php/cmbn/article/view/5353

Marisa Rifada, Nur Chamidah, Purhadi, Vita Ratnasari, 2021, Estimation of Nonparametric Ordinal Logistic Regression Model Using Local Maximum Likelihood Estimation, Commun. Math. Biol. Neurosci. 2021(28), pp.1-9. https://doi.org/10.28919/cmbn/5353

Berita Terkait

newsunair

newsunair

https://t.me/pump_upp