Dynamical Classes of Collective Attention on Twitter
J. Lehmann, B. Gonçalves, J. J. Ramasco, and C. Cattuto
WWW '12 Pages 251-260


Twitterハッシュタグの増減時系列で,(1)ピークと前に盛り上がったもの,(2)ピークと後に盛り上がったもの,(3)ピーク前後で盛り上がったもの,(4)ピーク時のみに盛り上がったもの,の4つのクラスに分ける.
SornetteらのPNASと似ているが,ベキ指数等難しい(?)関数型は持ち出さず,ただただ,ピーク前後の1週間とピーク時の書き込み数の比率を比較するという,かなりシンプルな方法.

ピークの抽出方法,単語を概念化する方法などがなかなか参考になる.
特に概念化の方法は,最終的に単語を18000のconceptsに分類するのだが,Stemmingで荒く単語を原型に直して,Lemmatisationでさらに,good=betterなどの難しい分類も行っている.
残念ながら日本語にはそのライブラリは見たらなそうだが,考え方は参考になりそう.WordNetをつかっているので,それは日本語版も存在するので.