Project ini dikerjakan berkolaborasi dengan Ismail Adima, Fafilia Masrofin, dan Arie Cipta Ramadhan guna menyelesaikan Tugas Akhir Mata Kuliah Temu Kembali Informasi ( information retrieval ), IPB.
Klasifikasi spam comment sederhana dari data UCI YouTube Spam Comment (https://archive.ics.uci.edu/ml/datasets/YouTube+Spam+Collection). Namun, project ini tidak menggunakan semua data. Project ini hanya menggunakan data Eminem karena jumlah datanya lebih besar dibanding data milik artis lain pada link tersebut. Project ini menggunakan metode Naive Bayes.
Klasifikasi dengan metode Naive Bayes efektif untuk mengelompokkan komentar yang termasuk dalam spam dan bukan spam pada situs YouTube, dengan akurasi sebesar 96% apabila menggunakan nilai laplace 0 dan akurasi sebesar 98% jika menggunakan nilai laplace 1.