Human behavior in online social systems
A. Grabowski
Eur. Phys. J. B 69, 605-611 (2009)


昨日読んだPRE論文に引き続き、実データ解析+簡単なモデルの論文。
調べているのは以下2つ。

  • Life span (アカウントが作成された時から、最後のログイン時刻までの時間)
  • Activity (何曲音楽を聴くか、本を読むか、レビューを書くか、などの活動)


使ったデータは以下4つ。

  • Skyrock (特にフランス語圏の人に人気のSNS) ;9823234 users
  • LastFM (音楽好きの人のウェブサイト) ;1192118 users
  • Shelfari (本好きの人のウェブサイト) ;253967 users
  • XFire (ゲームのウェブサイト) ;5241578 users


分布は、べき指数は活動によって異なるものの、同じベキ分布になっている。
特にSkyrockのactivity分布にはべき指数が異なる2つのregimeがあり、これは、
モデルを表す1式に出てくるbが大きい場合に2つのregimeが出現する。
モデルはactivityがtステップ後にxになる確率、を1式のp(x,t)を決めていて、
時間tの逆数に比例し、元々のactivityの数xに比例することを仮定する。
それの、底上げ(切片)に対応するのが、b。
こうすることにより、activityのベキ分布が数値的、解析的に導出できる。
ただ、このままのモデルだと寿命の考え方が入っていないので、
Listを用いて、興味がある順に実行して行く(interest-driven model)、という考え方を加える。
(詳しくはPREの論文へ。)

実データ解析として、activityは時間が経つにつれ緩やかになり、べき指数は1よりも小さいベキ関数的な型。
→いわゆる"飽き"の効果だろう。(Fig.6,7あたり)