-
Notifications
You must be signed in to change notification settings - Fork 1
Narzędzia do analizy sentymentu
dmydlarz edited this page Nov 25, 2013
·
4 revisions
-
NLTK - Natural Language Toolkit
- biblioteka wspomagająca przetwarzanie języka naturalnego w Pythonie
-
Twitter sentiment analysis using Python and NLTK
- wpis dość dokładnie opisujący sposób analizy sentymentu wypowiedzi (z naciskiem na Twittera) przy użyciu NLTK.
-
Sentiment Analysis with Python NLTK Text Classification
- gotowe narzędzie do oceny sentymentu wypowiedzi
- można korzystać za pomocą REST-a (jednak posiada ograniczenia na liczbę zapytań)
- http://www.sentiment140.com/
- narzędzie stworzone przez studentów Stanford University do analizy sentymentu wypowiedzi na Twitterze
- prezentuje sentyment wypowiedzi dla zadanego query
- udostępnia zbiór treningowy
- ręcznie sklasyfikowane 498 wpisów (negatywne, neutralne, pozytywne)
- If you use this data, please cite Sentiment140 as your source. (więcej)
- http://www.sananalytics.com/lab/twitter-sentiment/
- korpus składający się z 5513 ręcznie sklasyfikowanych wpisów z Twittera odnoszących się do jednego z 4 tematów (Apple, Google, Microsoft, Twitter).
- klasyfikacja wpisów na: pozytywne, neutralne, negatywne, nieistotne (nie w języku angielskim, nie na temat, np. spam)
- klasyfikacji dokonał Amerykanin z płynnym angielskim
- dozwolony użytek
- w związku z ograniczeniami Twittera, treść wpisów trzeba pobrać sobie samodzielnie (w korpusie są tylko ID wpisów)
- dostarczony jest do tego odpowiedni skrypt
- całość ściągania powinna zająć ok 43 godziny