Spotkanie 2013.12.19

pobrano wpisów z kolejnych spotkań (już w sumie 26)
przyjrzano się zebranych dotychczas danym (więcej)
sprawdzono jak był badany sentyment przez autorów książki Twitter Data Analytics (http://tweettracker.fulton.asu.edu/tda/)
- używano naiwnego klasyfikatora Bayesa (Naive Bayes Classifier)
- jako zbiór treningowy wybrano podzbiór wpisów z emotikonami pozytywnymi i negatywnymi

popatrzeć lepiej na te emotikony (te jednoznakowe, wykrzykniki)
- 100 pierwszych w bazie sprawdzić jakie są i sprawdzić czy query je znajduje
sieci społeczne
- poszukać zależności między osobami, które często się pojawiały (w każdym lub prawie każdym meczu)
- czy z meczu na mecz sie te grupy zmieniaja, czy sa stale
- czy pisza do siebie czy nie
- policzyc miary centralnosci dla tych najczestszych
  - modularity
  - cfinder
  - gephi - cytoscape - mam dostac maila @azygmunt
- rozne rodzaje powiazan - jak traktujemy?
  - osobno - odpowiedzi, retweety
  - wspolnie - i porownac
  - policzyc w tych sieciach wszystko
- lokalizacja - czy zawsze uzywaja, czy czasami
- sentyment wypowiedzi
Cel prac?
- praca analityczna
- narzędzie tylko przy okazji

Provide feedback