2012/3/7,8 言語研究と統計2012 統計数理研究所


大学で英語教育等を主に手がけている先生方が,初級の学習者が使いがちな単語は何か,
間違いがちな文は何か,などを研究している様子な学会.
ということで,主に扱うのは英語の文書で「コーパス」という様々な文書の集まりを料理して,議論する.
だからコーパスも,中国人の英語学習者コーパス,日本人の英語学習者コーパスなどなかなか
マニアックなものも存在していて,そういうったものを扱う.
また,学習者が断念する語彙数なんかを推定したり(英語教材には役立ちそうな知識).


英語学習以外にも,大衆紙(The Sunとか)と高級紙(Financial Times)とで使われる単語の違い,
品詞の違い,1文あたりの単語数の違い等.
同じ事件を扱っている場合も,大衆紙と高級紙では,単語がどう違うか等も議論出来る.
例えば,すでに知られていることに英語のジャンル(Academicと話言葉)では,
品詞の使用率に差があることは既に知られているそうだ.
さらに,新聞の大きさが,ダブロイド版という片手サイズになってからは,
文書の長さがかわった,など.ブログー>ツイッターでみられそうな違いも議論される.


また,男女の違いと言葉の違いなんかも議論されている.
ThanksとThank youの使われ方の違いで,男性のほうが年齢とともにThank youという丁寧な使い方率が増えるとか.
これは年齢別の話言葉コーパス,というのが存在していて,このデータを使う.
結果はこれまで,女性のほうが丁寧な使い方をする,と言われてきた経験則には反する.
ただ,社会的な身分が上がったり,上下関係の社会に巻き込まれることが多いため,男性のほうが必然的に部下にThank youが
増えると解釈すれば,納得出来る.ということで,社会学っぽくもある.


使っている手法はエクセルなどの統計ソフトにデータを流し込んで,クラスター分析したり頻度カウントしたり,
交差検定という検定をしたり,という感じで真新しさはないけれど,
一般の興味に寄り添った,ネタを拾いにいくにはよい研究会だった.