PERBANDINGAN KLASIFIKASI TUGAS AKHIR MAHASISWA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER DAN K-NEAREST NEIGHBOR
DOI:
https://doi.org/10.24014/sitekin.v14i1.2707Keywords:
10-fold cross validation, Confusion matrix, klasifikasi, K-Nearest Neighbor, Naïve Bayes Classifier, tugas akhir, WEKAAbstract
Klasifikasi merupakan salah satu cara untuk mengorganisasikan teks sehingga teks yang memiliki isi yang sama akan dikelompokkan kedalam kategori yang sama. Tugas akhir merupakan salah satu syarat yang harus dipenuhi oleh setiap mahasiswa untuk menyelesaikan pendidikannya diperguruan tinggi. Pada jurusan Teknik Informatika, tugas akhir dikelompokkan dalam dua topik umum yaitu Ilmu Komputer dan Teknologi Informasi. Oleh karena itu akan dilakukan penelitian untuk melakukan klasifikasi terhadap tugas akhir mahasiswa Teknik Informatika dengan membandingkan metode Naïve Bayes Classifier dan K-Nearets Neighbor, karena metode ini merupakan algoritma populer dalam melakukan proses pengklasifikasian teks. Dalam penelitian ini akan dilakukan perbandingan hasil klasifikasi berdasarkan abstrak bahasa Indonesia dan daftar isi dari tugas akhir. Proses metode Naïve Bayes Classifier dan K-Nearest Neighbor dilakukan dengan fungsi metode Naïve Bayes Classifier dan K-Nearest Neighbor yang ada pada WEKA. Pengujian akurasi metode pada penelitian ini dilakukan dengan test option 10-fold cross validation dan evaluasi data uji menggunakan confusion matrix. Dari penelitian yang telah dilakukan, didapatkan hasil pada seratus data tugas akhir dengan jumlah kelas acak, metode Naïve Bayes menghasilkan nilai akurasi lebih baik, yaitu sebesar 87%. Pengujian pada metode K-Nearest Neighbor menghasilkan nilai akurasi 84% dengan nilai k=3, 85% dengan nilai k=5, 86% dengan nilai k=7 dan 84% dengan nilai k=9.References
Arief, Abdullah. (2014). Klasifikasi Kualitas Udara Pekanbaru Menggunakan Algoritma K-NN dengan Euclidean Distance Berdasarkan Kategori Indeks Standar Pencemaran Udara (ISPU). Tugas Akhir Teknik Informatika UIN Suska Riau
Bintana, Rizqa Raaiqa .(2012). Penerapan Model Okapi Bm25 Pada Sistem Temu
Kembali Informasi. Tugas Akhir Teknik Informatika UIN Suska Riau.
Cios, Krzstof J. Etc.( 2007).Data Mining A Knowledge Discovery Approach, Springer.
Darujati, Cahyo (2010). Perbandingan Klasifikasi Dokumen Teks Menggunakan Metode Naïve Bayes Dengan K-Nearest Neighbor.Jurnal Link (ISSN-1858-4667) Volume 13Nomor 1, 2010
Fachrurrazi, S. (2011). Penggunaan Metode Support Vector Machine (SVM) Untuk Mengklasifikasi Dan Memprediksi Angkutan Udara Jenis Penerbangan Domestik Dan Penerbangan Internasional Di Banda Aceh.Thesis Fakultas Matematika dan Ilmu Pengetahuan Alam USU.
Gandhi, Vaibhav C. dan Jignesh A.Prajapati. (2012). Review on Comparison between Text Classification Algorithms.International Journal of Emerging Trends & Technology in Computer Science (IJETTCS) Volume 1, Issue 3 September-October, 2012.
Hasuli, R. (2015). Sistem Temu Kembali Informasi Abstrak Tugas Akhir Menggunakan Algoritma Genetika Dengan Faktor Jaccard Similarity.Tugas Akhir Teknik Informatika UIN Suska Riau
Kohavi, Ron (1995). A Study if Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection. International Joint Conference of Artificial Intelligence (IJCAI).
Krisandi, Nobertus.,dkk (2013). Algoritma k-Nearest Neighbor Dalam Klasifikasi Data Hasil Produksi Kelapa Sawit Pada PT.Minamas Kecamatan Parindu. Buletin Ilmiah Math.Stat. dan Terapannya (Bimaster) Volume 02, No.01 2013: hal. 33-38
Kurniawan, Bambang.,dkk (2012). Klasifikasi Konten Berita Dengan Metode Text Mining. Jurnal Dunia Teknologi Informasi Vol.1, No.1, 2012: 14-19.
Lorena, Selvia., dkk (2013). Penggunaan Metode Naïve Bayes Classifier Pada Aplikasi Perpustakaan. Jurnal Teknologi dan Informasi Universitas Komputer Indonesia Vol.1, No.6.
Mustika, A. (2015). Penerapan Metode Support Vector Machine Dalam Klasifikasi Sentimen Tweet Public Figure.Tugas Akhir Teknik Informatika UIN Suska Riau
Pranatha, Alifi Adia (2012). Analisis Perbandingan Lima Metode Klasifikasi Pada Dataset Sensus Penduduk. Jurnal Sistem Informasi. Vol 4, No.2,2012: 127-134.
Rosdiansyah, Defri (2014). Analisis Sentimen TwitterMenggunakan Metode K-Nearest Neighbor danPendekatan Lexicon. Tugas Akhir Teknik Informatika UIN Suska Riau
Saraswati, N.W. Sumartini (2011). Text Mining Dengan Metode Naïve Bayes Classifier dan Support Vector Machine untuk Sentimen Analysis. Thesis Teknik Elektro Universitas Udayana Denpasar.
Santoso, Deddy., dkk (2014) Perbandingan Kinerja Metode Naïve Bayes, K-Nearest Neighbor, dan Metode Gabungan K-Means dan LVQ dalam pengkategorian Buku Komputer Berbahasa Indonesia Berdasarkan Judul dan Sinopsis. Jurnal Ilmu Komputer Universitas Brawijaya.
Downloads
Published
Issue
Section
License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License
Copyright Notice
An author who publishes in the SITEKIN Journal agrees to the following terms:
- Author retains the copyright and grants the journal the right of first publication of the work simultaneously licensed under the Creative Commons Attribution-ShareAlike 4.0 License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal
- Author is able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book) with the acknowledgement of its initial publication in this journal.
- Author is permitted and encouraged to post his/her work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of the published work (See The Effect of Open Access).
Read more about the Creative Commons Attribution-ShareAlike 4.0 Licence here: https://creativecommons.org/licenses/by-sa/4.0/.