Fluctuations in Wikipedia access-rate and edit-event data
Mirko Kämpf, , Sebastian Tismer, Jan W. Kantelhardt, Lev Muchnik
Physica A 391 (2012) 6101–6111


Wikipeidaへのアクセス率とedit回数を用いて,バースト性をチェックしたもの。
バーストの前後の定義は,ピーク時のexp(-1)倍になるかどうかで定義。また,バースト期間の当てはまりも許さない。そして,ピークの前後でバーストの継続時間をチェック。(Fig.2)
それぞれでべき関数と指数関数をフィットしたところ,指数フィットの特性時間が24時間以内,べきフィットのべき指数が0.3より大きいところはまだ,当てはまりが良い傾向があった。しかし,全体としては,どちらも当てはまりが悪く,異なる強度のランダムノイズが主要な役割をしているという結論。この結論は,そもそもバーストの定義がアドホックなのでちょっと不完全な印象。


異なる強度のランダムノイズ+非定常,というところで使える手法で導入されるのがDeterended Flucuation Analysis (DFA)。DFAフラクタル解析法の一つで,観測データの積分値について,局所トレンドを除いたあとのノイズを足し上げ,観測窓を変えてどう変化するかをみて,その指数で判定する。指数は0.5であればホワイトノイズ,1.0であれば1/f揺らぎ,となる。結果,指数はランダムなものと,バースト性が強いものでどちらも平均値が0.9程度になるが,バースト性が強いものは分布の裾野が広い。


論文の結論としてはアクセスはスケーリング則がなりたち何がしかの相関を持つ。他方,editはホワイトノイズに近く,長時間相関はみられない。アクセス自体も,なぜ相関が生じるのかは(他の人がアクセスしている様子などは分からないはずなのに),まだ良くわからない。


ついでにバーストから元に戻るまでのinter event timeの分布を見た所,stretched exponentialになっていた。このstretched exponentialは他にもいろいろな現象で確認されているようだ。