The small world of human language
Ramon Ferrer i Cancho, and Richard V. Solé
Proc. R. Soc. Lond. B vol. 268 no. 1482 2261-2265 (2001)


言語ネットワークの解析結果,BarabasiとAlbertの論文に引用されていたもの.
データはBritish National Corpusの10^7単語の3/4を使って,ネットワークを構築.
ネットワークは,ノードが単語,同じ文章中の2単語隣まで繋いだ無向リンクから.
単語iとjのリンク確率をpijが,ランダムより大きい(pij>pipj)場合のみに制約したネットワーク(restricted network;RSW)と,
そうでないネットワーク(unrestricted network;UNW)を用意し,その最大強連結成分に注目する.
出てきたネットワークの特徴はRSWもUNWも大差はない.
UWN; 48万ノード,平均リンク数74,クラスター係数0.69
RWN; 46万ノード,平均リンク数70,クラスター係数0.43
リンク数の分布は確率密度でリンク数が10^3より小さいところは,-1.5のべき乗,
大きいところは-2.7のべき乗になるとのこと.


言語ネットワークもよく知られたcomplex networkのように,
大きいクラスター係数,リンクの分布がベキのスモールワールド的性質と,スケーフルリー的性質がある.


脳に障害がある人の場合はどうなるのか,という議論が最後にある,興味深い.