Skip to content

Latest commit

 

History

History
11 lines (10 loc) · 766 Bytes

README.md

File metadata and controls

11 lines (10 loc) · 766 Bytes

Gemastik13/Twitter Sentiment Analysis

Analisis sentimen tweet dari twitter yang mempunyai hashtag #RUUPKS atau sejenisnya. Langkah-langkah dalam analisis sentimen pada kode ini adalah:

  1. Data mining dari twitter menggunakan tweepy
  2. Data cleaning yang terdiri dari:
  • Preprocessing tweet untuk menghapus kata yang tidak dibutuhkan seperti kata yang mengandung hashtag,tanggal,usernames dan emoji.
  • Mengganti beberapa kata tidak baku dengan kata bakunya
  • Lemmatize
  1. Menggunakan bag of words dan TFIDF untuk mendapatkan dataframe baru sebelum dimasukkan kepada model machine learning
  2. Menggunakan model: Naive bayes,random forest, SGD, dan word2vec untuk memprediksi sentimen dari sebuah tweet
  3. Menilai performa model dengan ROC AUC dan confusion matrix