Complex systems: Unzipping Zipf's law
L. Adamic
Nature 474, 164–165 (09 June 2011)


少し前のBaekらのZipf's law unzippedのレビュー記事。
これまでに、Zipf則だとかPareto則だとか、ベキ乗に従う分布が報告され、
様々にそのメカニズムがモデル化されてきた。
しかし、

  1. 実際の分布は僅かながらでもズレがあり、特にexponential cut-offのテイルがある。
  2. システム固有の要素をモデルは含んでいる。

という問題点があった。
それを解決しようとしたのがBaekらのRandom Group Formation(RGB)モデル。


RGBモデルでは、M個のアイテムを、N個のグループに分けるシンプルなもの。
ルールは

  1. あるアイテムが、どのクループでも等しく見つけられるよう、エントロピーを最大化する。
  2. あるアイテムが入るグループのサイズしか分からないが、そのアイテムが入るべきグループの情報量を最小化する、グループサイズの分布を実現する。


このとき、ベキ分布と、exponential cut-offが実現する。
対象によらず、グループ分けの概念だけで、共通するべき分布のメカニズムを見いだしたことが新しい。
しかしまだ、他のモデルに取って代わられる選択肢もあるだろう、という話。


preferential-attachmentモデルも、惜しいところではあるが、
その解釈に置いて、例えば言語ネットワークでは、principle of least effortなのか、
文章とスペースのランダムな並びに由来するのか、というのはどちらもありえ、
preferential-attachmentは、言語において異なる解釈をされている、
そう言う意味で不完全であるとのこと。