久しぶりにmecabの標準辞書をDLして確認した.過去の自分の作業を検証するため.
IPA 辞書(推奨)をサイトからDLした.
中に,Conjunction.csvとか品詞別に辞書がある.
形容詞はAdj.csvで,全部で27210項目あるのだが,これは各形容詞の活用形(仮定,過去形など)を含んでいるためで,原型だけ出力してソートすると全部で1796項目ある.ちなみにファイル形式はEUC-JP.
以前,私が検索した時は,この原型だけを対象に検索していて,対象単語は1781単語だった.
ここから,一度も現れなかった単語を除いた1771単語になる.
1796単語 -> 1781単語の理由がよくわからないが,15単語なのでおよそ3年前の時の単語のリストアップの時より,
辞書が少し変わったか,当時のスキルで抜け落ちていたかのどちらかだと考えられる.


自分のための確認でした.