Predictability of conversation partners
T. Takaguchi, M. Nakamura, N. Sato, K. Yano, and N. Masuda
arXiv:1104.5344


日立のビジネス顕微鏡のデータを用いた人間の会話ネットワークの分析。
個人がノードで、会話の多さに応じたweightを持つリンクを持っているネットワーク。
#会話時間も記録しているが、基本的に会話のイベント数で重み等をカウントする。
大きなウリとしては、次の会話のパートナーもデータからある程度予測できるよ、という点。
その予測(Predictability)の定義は、Scienceの論文に元ネタ
のある、

  • random entropy
  • uncorrelated entropy
  • conditional entropy


の概念を用いて、特にuncorrelated entropyとconditional entropyの差で定量化する。
#元ネタ論文を読まないと、詳しいエントロピーの定義の意味が分からないので後で読む。


データの精度は1分単位で、N=163人の73Days、51879eventsのD1データと、N=211人の120Days、125345eventsのD2データを使う。
さらにGranovetterの"strength of weak tie"の概念もデータから確認している。(Fig.8(a))



データから理解を深めて、予測をしようと当初から試みているため挑戦的かつ面白い。