神戸の学会でBeon Jun Kimさんが韓国人の苗字の分布をやっていたので,私は日本語の苗字を解析してみようとふと思い立ち,2時間ほど.
私は頻度よりは,それぞれの漢字,が面白いかなと思ったので,ネットワークを作ってみた.例えば,田中,中村,村山,山田みたいなループを作るイメージ.これだと田->中->村->山->田(スタートに戻る)という有向リンクができる.

データはとりあえずインターネット上から拾ってきた.日本の姓の全国順位データベース
で,もっとも入り次数が多い単語は「田」だった.三文字以上の苗字はあまり多くはない.

  • 1文字: 841
  • 2文字: 21182
  • 3文字: 3030
  • 4文字: 25

全然,解析できてないけど,一応ネットワーク図もできた.もっと絞り込んでみやすくしないと意味ないけど.
韓国の研究と違って時間発展は追っかけられないから厳しいかな.ま,こういうメインでない20%の研究やるのも楽しい.