Polusi udara di India telah menyita perhatian publik dikarenakan menurut laporan World Health Organization (WHO) di tahun 2018 tentang Global Ambient Air Quality, India mengalami penurunan secara eksponensial kualitas udara di daerah tersebut. Kondisi demografi India saat ini yang memiliki populasi kaum muda sangat tinggi, dan berisiko mengalami gangguan kardiopulmoner akibat paparan polutan ditambah dengan efek kumulatif beberapa dekade mendatang. Menurut data dari World Bank Classification, India masih dalam level lower-middle-income country, dalam hal ini India juga berkonstribusi tumbuhnya aktivitas kendaraan bermotor secara pesat dan kota-kota industri berkontribusi pada tingginya tingkat polusi udara perkotaan. Hal tersebut juga dapat berdampak negatif pada sosial ekonomi, lingkungan, kesehatan, dan kesejahteraan masyarakat. Tingkat polusi udara yang tinggi terjadi di Delhi dan kota-kota besar India lainnya, karena konsentrasi kendaraan bermotor dan industri yang disertai intensitas polusi yang tinggi karena aktivitas tersebut. Apalagi Delhi merupakan kota yang terkurung daratan dengan kecepatan angin yang rendah dan udara yang kering sehingga dapat menghambat penyebaran polutan ke udara. Polusi udara dikategorikan sebagai invisible killer dan oleh karena itulah banyak yang perlu dilakukan untuk mengurangi tingkat polusi udara. Untuk itu perlu dilakukan kajian peramalan pencemaran udara dengan menggunakan metode statistik sebagai alat identifikasi.
Penelitian ini menganalisis data yang diperoleh dari situs resmi pemerintah India yang menyediakan data sumber polusi udara secara online. Data ini merupakan data runtun waktu (time series) terdiri dari hasil pengukuran SO2, NO2, dan PM10 dalam sepuluh tahun terakhir dalam bulan, tahun, stasiun pemantauan, dan wilayah. Data telah dikumpulkan dari instrumen lapangan dalam mikrogram per meter kubik. Studi ini hanya berfokus pada data rata-rata bulanan dalam satu dekade terakhir dari tahun 2005-2015. Data kurun waktu tersebut dibagi menjadi dua himpunan yaitu training set dan testing set dengan rasio 75:25 dimana rasio ini sesuai untuk prediksi time series. Training set dipergunakan untuk membangun model peramalan sedangkan testing set akan mengukur akurasi peramalan. Metode statistik yng dipergunakan adalah ARIMA, Naive Bayes classifier, Exponential Smoothing, dan TBATS.
Tren PM10 selama satu dekade mengalami peningkatan dari tahun ke tahun, digambarkan dengan nilai terendah adalah 15 ppm dan titik tertinggi mencapai 892 ppm. Sedangkan NO2 berkisar antara 6,3 ppm sampai dengan 224 ppm dan nilai minimum SO2 adalah 2 ppm dan maksimum 49 ppm.
PM10 umumnya digunakan untuk mengukur kualitas udara. Standar PM10 mencakup partikel dengan diameter 10 ppm atau kurang (0,0004 inci atau sepertujuh ukuran rambut manusia). Partikel kecil ini kemungkinan besar menjadi penyebab gangguan kesehatan yang merugikan karena kemampuannya untuk mencapai bagian bawah saluran pernapasan. Dalam kurun waktu satu dekade, NO2 mengalami pergerakan yang cukup besar dimana sedikit meningkat pada tahun 2012. Sebaliknya NO2 dapat secara khusus membuat anak-anak rentan terhadap penyakit pernafasan terutama pada musim dingin. Sulfur dioksida atau SO2 menurun dari tahun 2005 hingga kemudian meningkat pada tahun 2012. Sulfur dioksida dapat mengoksidasi dan membentuk asam sulfat, sehingga menyebabkan kerusakan paru-paru dan berbagai gangguan paru-paru seperti mengi dan sesak napas.
Seluruh gas pencemaran udara, PM10, NO2, dan SO2, diaplikasikan ke dalam empat model peramalan yaitu ARIMA, Naïve Bayesian, exponential smoothing, dan TBATS. Sebelum pembentukan model, turunan (diffential) dilakukan pada masing-masing runtun waktu, untuk mendapatkan data yang stationer dengan melihat hasil dari auto-correlation-function (ACF). Model-model tersebut terbentuk oleh training set dimana pola dan trend data stasioner menunjukkan nilai peramalan. Penilaian akurasi model menggunakan goodness of fit dan distribusi residual model masing-masing gas diukur dan digambarkan dalam grafik.
Root mean square error (RMSE) digunakan sebagai alat ukur untuk mengevaluasi keakuratan model. Berdasarkan nilai evaluasi pada PM10, ARIMA dan exponential smoothing memiliki nilai RMSE yang sama pada training. Namun, Exponential smoothing memiliki nilai RMSE terkecil pada testing. Karena testing error lebih kecil dari training error, artinya exponential smoothing dapat dikatakan sebagai model peramalan yang baik untuk memprediksi PM10 dibandingkan ARIMA. Dalam variable NO2, model prediksi ARIMA merupakan yang paling akurat dari yang lain tetapi tidak sedikit berbeda dengan TBATS dan exponential smoothing. Testing error lebih kecil dari training error yang menunjukkan bahwa ARIMA merupakan model prediksi yang memadai untuk memprediksi NO2. Sebuah studi juga menyatakan bahwa ARIMA lebih baik daripada exponential smoothing. Dalam kasus SO2,akurasi peramalan exponetial smoothing memiliki nilai RMSE terkecil pada dataset training yaitu 1,70. Namun, error pengujian lebih tinggi dari pada set pelatihan yaitu 2,17. Namun,metode Naïve Bayes mampu mendapatkan eror testing lebih rendah dibandingkan training yaitu 2,16; artinya Naïve Bayes merupakan model peramalan yang baik untuk SO2.
Penelitian ini menyimpulkan bahwa semua model memberikan kinerja yang dapat diterima dimana ARIMA dan Expoential Smoothing dibandingkan dengan model yang lain merupakan model peramalan yang lebih potensial atau preferable. Namun, setiap data memiliki karakteristik unik sehingga model peramalan tidak dapat menjamin performa yang tepat untuk semua jenis data.
Penulis: Tofan Agung Eka Prasetya
Informasi detail dari riset ini dapat dilihat pada tulisan kami di: https://www.researchgate.net/publication/341969982_Prediction_algorithms_to_forecast_air_pollution_in_Delhi_India_on_a_decade
Taufik, Muhamad Rifki, Eka Rosanti, Tofan Agung Eka Prasetya, and Tri Wijayanti Septiarini. 2020. “Prediction Algorithms to Forecast Air Pollution in Delhi India on a Decade.” In Journal of Physics: Conference Series, , 1–12.