Skip to content

Spotkanie 2014.01.16

dmydlarz edited this page Jan 16, 2014 · 3 revisions

Zrobiono

  • przyjrzano się bliżej emotikonom (ręczne sprawdzenie bazy) - więcej
  • zanalizowano najczęściej pojawiających się użytkowników - więcej
  • wykorzystano analizę sentymentu przy użyciu słowników
    • Bing Liu's Opinion Lexicon
    • MPQA Subjectivy Lexicon
  • w bazie znajduje się 149 539 wpisów z emotikonami, tj. 1.92% wszystkich wpisów
  • do analizy sentymentu można także wykorzystać ręcznie sklasyfikowane wpisy
    • 498 przez grupę Sentiment140 (oraz 1 600 000 sklasyfikowanych mechanicznie, na podstawie tychże 498)
    • 5513 - 1786 (nieistotnych) = 3727 korzystając przez Sanders-Twitter Sentiment Corpus

Do zrobienia

  • porównać analizę sentymentu przy użyciu słowników i przy użyciu ręcznie sklasyfikowanych tweetów
    • stworzyć prosty klasyfikator, przeszukiwać także pod kątem wyrazów zaprzeczających