Life span in online communities
A. Grabowski, and R. A. Kosiński
Phys. Rev. E 82, 066108 (2010) [5 pages]


自分たちの実データ解析から、モデル化の部分を取り出してきた論文。
Human behavior in online social systems
Properties of on-line social systems


実データの解析から、online social system上でのユーザの寿命の分布は、
ベキ分布になることを見出していて、それを再現するモデルの話。
例えば、10,000,000のユーザからなるcommunityや、音楽好き、本好きの人のcommunityの
ログイン履歴を調べて、最後にログインした時から、どのくらい時間がたったか、を「寿命」と想定。
もう1つは、web service上でのユーザのアクティビティ(音楽の再生回数、ブログ投稿数)も
ベキ分布になることも見出していて、それらも同時に再現するモデル。


モデルは、ユーザの持つtaskにpriorityをつけて、それを次々に実行していくもの。
taskによってpriorityの初期値異なり、時間発展はその初期値と現在のpriorityに比例すると仮定する。(式2)
priorityの高いものほど実行される確率が高くなる。
taskのpriority間の相関はなく、独立に次々に実行されていく。
低いtaskは捨てられることもあり、論文中の式4の確率で、ユーザはinactiveになる。
シミュレーションの結果、初期値の非対称性がある場合に、ベキ分布が生じる。


information propagationについては、SIRモデルのような感じで、3つの状態を考える。

  • ignorant(IG) : spreaderになりうるまだ、情報を知らない人。
  • spreader(SP) : 情報を知っていて広める人。
  • stifler(ST) : 情報を知っているが、飽きて広めない人。

IG -> SPへの遷移確率がパラメータとなり、これが噂自身の広まる早さに相当。
これに以下2つのルールをそれぞれ適用する。
SP -> STへの遷移確率を導入するのは同じだが、解釈が異なる。

  • 噂の忘れやすさに相当し、このパラメータが入ることでSIRモデルとほぼ同じ。
  • 病気と噂の伝播の違いに着目して、みんなが知っている噂はST状態になりやすい、と考える。

シミュレーションの結果、情報を知っていて広め続ける人の存在が
寿命のベキ分布に重要な役割を果たしている、としている。


元の実データ解析の論文も読んでおきたい。