Analisis sentimen tweet dari twitter yang mempunyai hashtag #RUUPKS atau sejenisnya. Langkah-langkah dalam analisis sentimen pada kode ini adalah:
- Data mining dari twitter menggunakan tweepy
- Data cleaning yang terdiri dari:
- Preprocessing tweet untuk menghapus kata yang tidak dibutuhkan seperti kata yang mengandung hashtag,tanggal,usernames dan emoji.
- Mengganti beberapa kata tidak baku dengan kata bakunya
- Lemmatize
- Menggunakan bag of words dan TFIDF untuk mendapatkan dataframe baru sebelum dimasukkan kepada model machine learning
- Menggunakan model: Naive bayes,random forest, SGD, dan word2vec untuk memprediksi sentimen dari sebuah tweet
- Menilai performa model dengan ROC AUC dan confusion matrix