EVALUASI BERBASIS NORMALIZE MUTUAL INFORMATION UNTUK PENGELOMPOKAN PENELITIAN DENGAN K-MEANS CLUSTERING
Abstract
Secara manual, aglomerasi dokumen dapat diklasifikasikan berdasarkan judul dokumen. Untuk jumlah dokumen yang tidak terlalu banyak, cara ini masih mungkin dilakukan, namun jika jumlah dokumen yang akan dikelompokkan bertambah, maka akan memakan waktu yang cukup lama. Metode yang digunakan dalam penelitian ini bekerja dengan mengklasifikasikan dokumen penelitian untuk memberikan informasi tentang hubungan antara isi penelitian yang satu dengan penelitian yang lain sehingga dapat dijadikan acuan bagi peneliti dengan fokus area yang berbeda, dalam memetakan skema kerjasama penelitian yang akan datang. Proses pengelompokan judul penelitian dilakukan dengan menggunakan metode k-Means Clustering pada sekumpulan judul penelitian dengan mengambil judul penelitian dan abstrak sebagai informasi yang dapat mewakili isi dokumen. Dokumen akan melalui proses preprocessing menggunakan metode text mining. Selanjutnya, judul dapat dikelompokkan menggunakan metode yang diterapkan. Hasilnya adalah membuat aplikasi yang secara otomatis dapat mengklasifikasikan judul penelitian untuk nilai k. Untuk mencapai keseimbangan dalam pemilihan jumlah cluster dan kualitas hasil pengelompokan, maka teknik pengujian kualitas cluster yang digunakan dalam penelitian ini adalah Normalized Mutual Information (NMI). Percobaan dilakukan dengan memasukkan jumlah cluster yang bervariasi untuk mendapatkan hasil pengelompokan terbaik dengan nilai NMI.
This license allows authors to copy, redistribute, remix, transform, and build upon the Work, in any format or medium, for any purpose including commercial purpose, on a perpetual basis provided they credit the Work and the authors. Authors
must explain any changes that were made from the original and may not suggest the authors endorse the use. The resultant work must be made available under the same terms, and must include a link to the CC BY 4.0 International License.