Uji Pengaruh Karakteristik Dataset pada Performa Algoritma Klasifikasi

Moch Ali Mahmudi

Abstract


Tujuan utama penelitian ini adalah untuk mengetahui pengaruh karakteristik set data pada performa algoritma klasifikasi. Pada penelitian ini digunakan tiga set data yang memiliki variasi tipe data, jumlah atribut, dan jumlah instan yang berbeda. Set data dibelajarkan pada algoritma klasifikasi, seperti SMO, Adaboost, CART, C4.5, dan Naïve Bayes. Penelitian ini menggunakan 10 fold cross validation sebagai metode evaluasi. Hasil penelitian menunjukkan bahwa, tipe data, jumlah atribut, dan ukuran set data mempengaruhi performa algoritma klasifikasi. Semakin banyak jumlah atribut, kecenderungan akurasi kelima algoritma uji semakin tinggi. Algoritma klasifikasi yang terbaik digunakan pada tipe data numerik adalah C4.5, sedangkan untuk data nominal adalah SMO. Algoritma klasifikasi yang terbaik digunakan pada small dataset atau set data dengan jumlah instan kecil adalah Naïve Bayes dan SMO, sedangkan yang terbaik digunakan pada big dataset adalah SMO dan C4.5.

Full Text:

PDF

References


Wahono, R.S. Data mining : Proses Data Mining. http://romisatriawahono.net. Diakses 9 Januari 2013

http://www.ics.uci.edu/~mlearn/MLRepository.html

http://www.sigkdd.org/kddcup/

Saini, D., Rajavat, A. 2013. Performance Evaluation System For Decision Tree Algorithms. Journal: International Journal Of Computers & Technology.

Fakhrurrifqi, M., Wardoyo R. 2013. Perbandingan Algoritma Nearest Network, C.45, dan LVQ untuk klasifikasi kemampuan mahasiswa. In IJCCS Universitas Gadjah Mada.

Abbas, O.A. 2008. Comparisons Beetwen Data Clustering Algorithm. The International Arab Journal of informastion Technology.

Tiwari, M., Jha, M.B., Yadav, O.P. 2012. Performance Analysis of Data mining Algorithm in weka.

Raiwal, J.S., Saxena, K. 2012. Performance Evaluation of SVM and K-Nearest Neighbor Algorithm over Medical Data set. International Journal of Computer Applications (0975 – 8887)

Wahyuni, E.S., Setiawan, N.A., Nugroho, H.A. 2013. Penerapan Metode Seleksi Fitur Pada Klasifikasi Kanker Payudara.

Subiyanto. A. 2008. Penggunaan Algoritma Klasifikasi Dalam Data Mining. Program Studi Sistem Informasi Fakultas Sains dan Teknologi UIN Jakarta


Article Metrics

Abstract has been read : 1567 times
PDF file viewed/downloaded: 0 times


DOI: http://doi.org/10.25273/research.v1i1.2449

Refbacks

  • There are currently no refbacks.




This work by Research is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.