Skip to content

Spotkanie 2013.12.19

dmydlarz edited this page Jan 9, 2014 · 4 revisions

Zrobiono

  • pobrano wpisów z kolejnych spotkań (już w sumie 26)
  • przyjrzano się zebranych dotychczas danym (więcej)
  • sprawdzono jak był badany sentyment przez autorów książki Twitter Data Analytics (http://tweettracker.fulton.asu.edu/tda/)
    • używano naiwnego klasyfikatora Bayesa (Naive Bayes Classifier)
    • jako zbiór treningowy wybrano podzbiór wpisów z emotikonami pozytywnymi i negatywnymi

Do zrobienia

  • popatrzeć lepiej na te emotikony (te jednoznakowe, wykrzykniki)
    • 100 pierwszych w bazie sprawdzić jakie są i sprawdzić czy query je znajduje
  • sieci społeczne
    • poszukać zależności między osobami, które często się pojawiały (w każdym lub prawie każdym meczu)
    • czy z meczu na mecz sie te grupy zmieniaja, czy sa stale
    • czy pisza do siebie czy nie
    • policzyc miary centralnosci dla tych najczestszych
      • modularity
      • cfinder
      • gephi - cytoscape - mam dostac maila @azygmunt
    • rozne rodzaje powiazan - jak traktujemy?
      • osobno - odpowiedzi, retweety
      • wspolnie - i porownac
      • policzyc w tych sieciach wszystko
    • lokalizacja - czy zawsze uzywaja, czy czasami
    • sentyment wypowiedzi
  • Cel prac?
    • praca analityczna
    • narzędzie tylko przy okazji