Prediksi Pemadaman Listrik dengan Menggunakan Regresi Logistik dan Pohon Keputusan

Share on facebook
Share on google
Share on twitter
Share on linkedin
Foto oleh Curbed NY

Terjadinya pemadaman listrik menimbulkan ketidaknyamanan bagi pelanggan termasuk pemasok energi. Ada berbagai faktor yang dapat memicu pemadaman listrik seperti petir, cuaca atau binatang. Dalam makalah ini, prediksi pemadaman listrik dilakukan dengan menggunakan dataset yang disediakan yaitu data petir dan laporan tripping. Metode machine learning dilakukan untuk memprediksi terjadinya pemadaman listrik dengan menggunakan Aplikasi Classification Learner di MATLAB. Sebelum melakukan metode pembelajaran mesin, data melalui pra-pemrosesan data untuk memastikan data bersih dan fitur signifikan untuk prediksi dapat dipilih untuk dijalankan di Aplikasi Classification Learner. Hasil penelitian menunjukkan bahwa Fine Tree merupakan model yang paling cocok digunakan untuk prediksi pemadaman listrik. Hasilnya dibandingkan dengan menggunakan Area Under Curve (AUC) dalam Receiving Operating Characteristic (ROC). Logistic Regression dan Coarse Tree menunjukkan nilai AUC paling rendah dibandingkan model lainnya dan Fine Tree memiliki nilai AUC tertinggi.

Penelitian ini dimulai dengan pengumpulan data dan pra-pengolahan data. Data tersebut diperoleh dari perusahaan pemasok energi dan dataset terdiri dari data petir, data cuaca, dan laporan tripping.

Untuk data lightning, semua dataset berada dalam file txt dan satu file terdiri dari data 2 hari. Ada 365 file txt yang dikumpulkan hanya untuk data kilat dan semua data ini digabungkan melalui command prompt. Untuk data cuaca dan laporan tersandung, kedua set data berada dalam file Excel. Walaupun dataset untuk data cuaca terdiri dari data 4 tahun, namun masih belum dianggap sebagai big data karena dataset dapat ditampung dalam file Excel. Hanya dataset petir yang memiliki data volume tinggi. Oleh karena itu, analitik data besar diterapkan untuk pra-proses data kilat.

Dalam penelitian ini, metodologi penelitian kami dimulai dengan analisis data. Analisis yang dilakukan meliputi analisis kriteria petir, data cuaca, dan korelasi dengan laporan tripping. Korelasi untuk melihat hubungan antara petir dan pemadaman listrik. Kemudian, penelitian ini dilanjutkan dengan membangun model prediktif dengan menggunakan metodologi pembelajaran mesin terbimbing. Model prediksi yang diterapkan dalam penelitian ini adalah

Regresi Logistik (LR) dan Pohon Keputusan (DT). LR diusulkan dalam penelitian ini karena dapat memprediksi kategoris variabel dependen dimana variabel biner yang berisi data sebagai ya dan tidak atau 1 dan 0. Model LR memprediksi persamaan P(Y=1) sebagai fungsi dari X .

DT juga diusulkan karena alasan yang sama seperti metode ini memberikan keputusan atau kemungkinan hasil peristiwa dengan menggunakan konstruksi “jika kemudian, yang lain”. Dengan kata lain, masalah dikategorisasikan sampai ditentukan kategori terakhir. Sebelum data digunakan untuk melatih model, dilakukan partisi data untuk memisahkan data menjadi kelompok pelatihan dan kelompok pengujian. Proses ini penting untuk mencegah masalah overfitting.

Terakhir, evaluasi kinerja dilakukan untuk menemukan model terbaik untuk setiap model prediksi. Model dibandingkan, dan model prediksi yang paling akurat dipilih.

Untuk Pohon keputusan (DT) tiga jenis model DT telah dilatih dan akurasi untuk ketiga model ini adalah 100% karena keterbatasan data pemadaman listrik. Model-model ini dilatih dengan data model LR yang sama.

Kesimpulan

Pada penelitian ini, analisis kejadian petir dilakukan dengan hanya memanfaatkan dataset tiga bulan yaitu Mei, Oktober, dan November tahun 2019. Semua data tiga bulan tersebut telah melalui metode pre-processing data sebelum dilakukan prediksi dengan menggunakan Mesin. Metode pembelajaran. Dari proses ini, beberapa fitur dalam data petir yang tidak diperlukan telah dikeluarkan dan beberapa fitur diurutkan sesuai urutannya. Korelasi antara amplitudo polaritas dan data petir telah dilakukan untuk mengetahui hubungan antara kedua variabel. Hanya satu bulan data yang diambil untuk analisis korelasi karena tidak ada cukup data untuk pemadaman listrik di set data bulan lainnya. Selanjutnya dilakukan prediksi pemadaman listrik dengan menggunakan Regresi Logistik dan Pohon Keputusan.

Kedua metode memberikan akurasi 100% tetapi kurva ROC dan AUC untuk masing-masing model menunjukkan hasil yang berbeda. Dari semua model tersebut, model yang terbaik adalah model Fine Tree karena nilai AUC paling tinggi diantara lainnya yaitu 0,79. Singkatnya, hasil korelasi dan prediksi dapat ditingkatkan jika ada cukup dataset yang disediakan untuk penelitian ini. Untuk penelitian selanjutnya, diharapkan dapat diperoleh lebih banyak data untuk mendapatkan hasil yang lebih baik. Karena lebih banyak data yang dikumpulkan akan menghasilkan volume data yang tinggi, analitik data besar yang tepat dengan pembelajaran mesin harus digunakan seperti Hadoop dengan Spark, Microsoft Azure Machine Learning Studio, atau Pembelajaran Mesin di AWS.

Penulis: Lilik Jamilatul Awalin, ST, SPd, MT, PhD.

Informasi detail dari riset ini dapat dilihat pada tulisan kami di:

https://iopscience.iop.org/article/10.1088/1742-6596/1988/1/012039/meta

Saidi, A. Y. N., Ramli, N. A., Muhammad, N., & Awalin, L. J. (2021, July). Power outage prediction by using logistic regression and decision tree. In Journal of Physics: Conference Series (Vol. 1988, No. 1, p. 012039). IOP Publishing

Berita Terkait

newsunair

newsunair

https://t.me/pump_upp