Network properties of written human language
A. P. Masucci and G. J. Rodgers
Phys. Rev. E 74, 026102 (2006)


言語のネットワークの特性について。
ノードは単語、リンクは隣り合う単語、の意味。


言語と言えば出現頻度がベキ分布になるZipfの法則があり、
Zipfの法則をネットワークの言葉で言うと、スケールフリーネットワーク
しかし、これだとランダムに単語を並び替えても再現できてしまう、
ということで、何が文章のネットワークの統計量として最適か?、と議論。


リンク互恵性が大切。
ネットワークの階層構造を記述することができるのが、クラスター係数らしい。(知らなかった。)


単語には2つのクラスがあって、
次数が小さな単語では、ややクラスター係数が大きいままフラットだが、
次数が大きくなるとクラスター係数は、次数に対して線形に小さくなり、
三角形はできにくい、という帰結。
nearest neighbor degreeでも同様の2つのクラスが見られた。
この2つの違いは、単語の担う役割の違いに由来するという考察。
それが、人間が扱う言語としての単語ネットワークだと。


モデルはDorogovtsev-Mendes modelを改良したものを使っている。
このDMモデルはpreferential attachmentのBAモデルにおいて、
新規参入時のリンクだけではなく、時間ごとに既存ノード間に
リンクも生まれる、というモデル。