cakrawala

Deteksi Pemalsuan Dokumen Tercetak dengan CNNs

Pada prinsipnya, forensik digital adalah teknologi yang berkaitan dengan masalah penegakan hukum untuk mengidentifikasi, mengumpulkan, menganalisis dan memeriksa bukti digital untuk membuktikan munculnya kriminalitas. Oleh karena itu, teknik dan bahan yang tepat diperlukan untuk mengidentifikasi objek forensik secara akurat dan tepat selama penyelidikan forensik.

Secara umum, metode yang tepat akan dapat menentukan sumber dokumen karena setiap printer memiliki karakteristik tekstur yang berbeda dari yang lain. Konten digital dapat dicetak secara bebas menjadi dokumen karena kemudahan dan aksesibilitas printer. Di sisi lain, dokumen cetak dapat dimanipulasi secara ilegal dan menjadi masalah kriminal seperti: dokumen palsu, uang palsu, pelanggaran hak cipta, dan sebagainya. Oleh karena itu, bagaimana mengembangkan alat penguji keamanan yang efisien dan tepat untuk mengidentifikasi sumber dokumen cetak adalah tugas penting saat ini.

Saat ini, tidak ada standar pasti untuk menguji forensik digital yang dipakai dalam sebuah identifikasi printer. Untuk membuat perbandingan yang adil, prosedur dan persyaratan eksperimental yang dilakukan dalam penelitian ini perlu sesuaikan dengan karya dari perintis. Pada dasarnya, biaya perhitungan disesuaikan dengan ukuran gambar, untuk itu waktu yang dibutuhkan juga selaras dengan gambar yang dipindai dan gambar mikroskopis. Hanya perhitungan pada gambar hasil pemindaian yang perlu dibahas di sini sehingga permasalahan lain dapat diturunkan dengan mudah.

Menurut survei literatur dan analisis yang disebutkan di atas, penggunaan fitur untuk melakukan filtering dan pengklasifikasian SVM adalah solusi yang paling umum digunakan. Pengklasifikasi pada tingkat akurasi tertinggi yang tuangkan pada teks atau dokumen gambar alami berasal dari SVM atau CNN berbasis model machine learning untuk identifikasi sumber printer. Oleh karena itu, percobaan dalam penelitian ini berfokus pada penggunaan model pembelajaran mesin berbasis CNN sebagai pengklasifikasi utama.

Namun demikian, penggunaan set fitur umumnya diimplementasikan secara independen berdasarkan ketersediaan perhitungan. Sebagai konsekuensinya, penerapan fitur filtering dari teknik-teknik yang mendasari juga melibatkan para ahli dan pengetahuan khusus untuk mengeksplorasi set fitur terbaik dan bagaimana memilih dengan bijak fitur-fitur paling penting di antara set fitur yang sesua. Oleh karena itu, karakter-karakter tersebut pada umumnya adalah fitur manual yang membutuhkan waktu pelatihan yang cukup.

Jaringan saraf konvolusi terdiri dari lima lapisan jaringan dasar dalam sebuah model Klasifikasi dengan CNNs untuk huruf “永” : lapisan input, lapisan konvolusional, rectified linear unit ( ReLU), lapisan penyatuan dan lapisan yang terhubung sepenuhnya.

(1) Lapisan Input: Pintu masuk untuk data input

Pada lapisan Input semua data melalui pintu ini sebelum diproses lebih lanjut. Dalam menentukan sampel data, dokumen tercetak disesuaikan dengan ukuran gambar berdasarkan dimensinya. Sebagai contoh, kami tentukan dimensi gambar dengan ukuran 51 × 51 piksel, gambar skala abu-abu dengan masing-masing ukuran 45 × 45 piksel dan 90 × 90 piksel.

(2) Lapisan Konvolusional

Lapisan ini berisi kombinasi filter yang ukurannya tetap dan digunakan untuk menjalankan konvolusi input data, sehingga menghasilkan apa yang disebut peta nilai eigen (fitur peta). Filter ini dapat menyediakan modul yang berguna untuk memperkenalkan gambar, seperti gambar tepi, pola reguler dan perubahan warna. Jumlah yang akan digunakan tergantung pada ukuran data, rumitnya gambar dan ukuran gambar.

Studi ini menggunakan tiga lapisan konvolusional, masing-masing ukuran filter lapisan konvolusional adalah 5 × 5, zero-padding pengaturan ke-2 dan langkah-langkahnya ditentukan pada step ke-1. Pada langkah ini gambar yang masuk pada lapisan konvolusional pertama dan ketiga difilter dengan 32 filter sedangkan lapisan konvolusionalnya menggunakan 64 filter.

(3) Rectified Linear Unit (ReLU)

ReLU umumnya mengikuti operasi lapisan konvolusional dan menyediakan output dengan fungsi aktivasi non-saturasi f (x) = max (0, x). Menurut penelitian Krizhevsky [5], persamaan ini dapat digunakan dalam konvolusi jaringan saraf dalam konvergensi pelatihan yang cepat, juga berhubungan dengan masalah gradien untuk mempercepat pelatihan.

(4) Lapisan pooling (pooling layer)

Lapisan pooling difungsikan mengurangi dimensi gambar atau citra untuk lapisan jaringan berikutnya. Setiap layer pooling memiliki dimensi 2 × 2, dan langkahnya diatur pada step ke- 2. Lapisan pooling pertama dan kedua menggunakan max-pooling dan yang terakhir menggunakan pooling rata-rata.

(5) Lapisan yang terhubungkan penuh (Fully-connected Layers)

Hanya satu lapisan yang sepenuhnya terhubung digunakan adalah lapisan soft-max dan lapisan klasifikasi untuk mengklasifikasikan sumber gambar yang terdiri dari 12 printer.

Dalam sebuah ekperimen, waktu tambahan dan pekerjaan diperlukan untuk mencari pengaturan parameter terbaik untuk struktur pembelajaran yang mendalam. Karena banyak struktur pembelajaran dalam yang canggih dan rumit umumnya didasarkan pada CNN, penulis telah menerapkan model, membangun struktur langkah demi langkah, dan menyempurnakan parameter untuk mendapatkan akurasi tertinggi untuk identifikasi sumber printer dalam penelitian ini.

Untuk memecahkan masalah klasifikasi gambar yang kompleks dalam implementasi sains data, dikembangkan oleh Convolutional Neural Networks (CNNs) pembelajaran mendalam yang dapat mempelajari fitur-fitur secara otomatis. Eksperimen sistematis dapat dilakukan dengan serangkaian ujicoba untuk menghasilkan tingkat akurasi klasifikasi yang diinginkan.

Tingkat akurasi tertinggi untuk 1 conv (7 layer) CNN adalah 98,99% untuk karakter Cina “永” adalah 99,36%. Akan tetapi ketika menggunakan 2 conv (10 Layer) menghasilkan tingkat akurasi lebih rendah 98,19% dan penggunaan conv 3 (13 layer) memiliki tingkat akurasi yang turun menjadi 91,33%. Dari pengamatan di atas, jumlah layer yang banyak belum tentu memiliki tingkat akurasi yang tinggi.

Sehingga bisa disimpulkan bahwa struktur CNN yang lebih dalam dan terdiri lebih dari satu konvolusi tidak meningkatkan tingkat akurasi untuk klasifikasi ketika input data berupa teks. Secara umum, ukuran data dari sumber yang dicetak pada dasarnya berskala kecil karena data digital perlu dicetak, dipindai, diekstraksi dan ditandai untuk referensi. Oleh karena itulah dibutuhkan keterlibatan manusia yang untuk menentukan sampel yang sesusui untuk implementasi metode ini. (*)

Penulis: Imam Yuadi

Untuk lebih jelasnya dapat dibaca pada Jurnal Signal Processing: Image Communication. Volume 70, February 2019, Pages 184-198 dengan judul “Deep learning for printed document source identification”. https://www.sciencedirect.com/science/article/pii/S0923596518308579?via%3Dihub