■ - kermitonphd’s diary

神戸の学会でBeon Jun Kimさんが韓国人の苗字の分布をやっていたので，私は日本語の苗字を解析してみようとふと思い立ち，２時間ほど．
私は頻度よりは，それぞれの漢字，が面白いかなと思ったので，ネットワークを作ってみた．例えば，田中，中村，村山，山田みたいなループを作るイメージ．これだと田->中->村->山->田(スタートに戻る）という有向リンクができる．

データはとりあえずインターネット上から拾ってきた．日本の姓の全国順位データベース．
で，もっとも入り次数が多い単語は「田」だった．三文字以上の苗字はあまり多くはない．

1文字: 841
2文字: 21182
3文字: 3030
4文字: 25

全然，解析できてないけど，一応ネットワーク図もできた．もっと絞り込んでみやすくしないと意味ないけど．
韓国の研究と違って時間発展は追っかけられないから厳しいかな．ま，こういうメインでない20%の研究やるのも楽しい．