What's in a crowd? Analysis of face-to-face behavioral networks
Lorenzo Isella, Juliette Stehlé, Alain Barrat, Ciro Cattuto, Jean-François Pinton and Wouter Van den Broeck
Journal of Theoretical Biology (Article in Press)
doi:10.1016/j.jtbi.2010.11.033


RFIDタグを使った人間の実際のコンタクトネットワークに関する論文。
サンプルにしたのは以下の2つのネットワークで、それらを比較する事がメインのトピック。

  • HT09 conference as Closed network
  • Science Gallery (SG) museum as Open network

時間データ(美術館への入場時間等)、誰と誰が何秒接触したか、のデータががあるので
それらを使って、まずは1日にaggregate したときの静的なネットワークの解析からスタート。


平均リンク数はHT09だと20(1分以下の接触を除くと7.5)、
SGだと8(1分以下の接触を除くと3.5)という結果で異なる。
美術館に来る人同士は、他人なので接触数は少ないよね、という当然の結果 (Fig.5)。
ちなみに美術館での滞在時かは平均35分とからしい、分布は対数正規 (Fig.6)。


2つのネットワークで共通するのは、個人間の接触時間の分布で、
200秒くらいまでのスケールだと、どちらもベキ分布になる (Fig.8, 9)。
異なるのは、個人がどのくらいの時間他人と接触していたかの分布で、
これは、明らかに差が出て、HT09だと分布の最頻値は500秒あたりになるのに対して、
SGだと10秒以下に最頻値が来る。(当然の結果だが、定量的にもちゃんと見えている。)


次に行うのがPercolation analysisで、リンクをいろいろな方法で
取り除いて行くときに、ネットワークがどのくらいバラバラにならないかを比較する。
リンクの取り除き方法は、

  • リンクの重み(接触時間)の昇順
  • リンクの重み(接触時間)の降順
  • トポロジー的な重複の昇順 (詳細は論文の(3)式)
  • 隣人の類似度(コサイン類似度 (4)式)の昇順

で、行うが、どの方法でもSGネットワークは大変もろく、すぐにバラバラになる。


最後に、それらのネットワークを使って、感染モデル(SI-model)のシミュレーションを行う。
感染元(seed)を決めて、そこからリンク上を伝って感染する。
1日をaggregateしただけのネットワーク(Transmission network)と、
seedがネットワークに入ってきた時間を考慮するネットワーク(partially aggregated network)を使って行う。
すると全く異なる結果が得られて、いつ感染が始まったかの時間を考慮しないと、
結果としてネットワーク上にどこまで感染が広がったかに異なる結果を得るのでmisleadingだという。
(Temporal properties of the contacts are crucial in determining the spreading patterns and their properties.)
また当然、HT09の方が接触時間、数も多いので感染はすぐに広まる。


それにしても、この論文、図が多く、トピック詰め込み気味で、
論文の主旨をうっかりすると見失いそうになった。
データがあって、面白そうな事がいろいろあって、伝えたい気持ちは分かるけど、
自分も気をつけようと思った。。。