Skip to content

Narzędzia do analizy sentymentu

dmydlarz edited this page Nov 25, 2013 · 4 revisions

NLTK

Gotowe narzędzia

Sentiment140

  • http://www.sentiment140.com/
  • narzędzie stworzone przez studentów Stanford University do analizy sentymentu wypowiedzi na Twitterze
  • prezentuje sentyment wypowiedzi dla zadanego query
  • udostępnia zbiór treningowy
    • ręcznie sklasyfikowane 498 wpisów (negatywne, neutralne, pozytywne)
    • If you use this data, please cite Sentiment140 as your source. (więcej)

Sanders-Twitter Sentiment Corpus

  • http://www.sananalytics.com/lab/twitter-sentiment/
  • korpus składający się z 5513 ręcznie sklasyfikowanych wpisów z Twittera odnoszących się do jednego z 4 tematów (Apple, Google, Microsoft, Twitter).
  • klasyfikacja wpisów na: pozytywne, neutralne, negatywne, nieistotne (nie w języku angielskim, nie na temat, np. spam)
  • klasyfikacji dokonał Amerykanin z płynnym angielskim
  • dozwolony użytek
  • w związku z ograniczeniami Twittera, treść wpisów trzeba pobrać sobie samodzielnie (w korpusie są tylko ID wpisów)
    • dostarczony jest do tego odpowiedni skrypt
    • całość ściągania powinna zająć ok 43 godziny