Human language reveals a universal positivity bias
P. S. Dodds, E. M. Clark, S. Desu, M. R. Frank, A. J. Reagan, J. R. Williams, L. Mitchell, K. D. Harris, I. M. Kloumann, J. P. Bagrow, K. Megerdoomian, M. T. McMahon, B. F. Tivnan, and C. M. Danforth, Proc. Natl. Acad. Sci. 201411678 (2015).


ポリアンナ仮説(「よかった探し」の女の子の名前)で,人はポジティブバイアスを持っていると言われる.ポジティブなこは細かく覚えているのに,ネガティブなことはそうでもない.またポジティブなことばかりが起こると信じているので,ネガティブなことが起こると目立つ,という風にも心理学では使われているようだ.ざっくり言うと,人はポジティブなことが多く起こると信じる傾向があるから,人が使う自然言語の単語もポジティブなものが多いよ,ということ.


そのポリアンナ仮説を大規模なデータ,異なる情報源,言語でも検証したよ,という論文.何がすごいって,それまでの研究*1では英語だけに限って行われていたものを,アラビア語,中国語を含む10言語,新聞からTwitterまで24のcorpusで試したという点.またAMTみたいなものを用いて,よく使われている約10,000単語を,被験者に1-9でHappyからSadでレーティングしてもらって,それを総合して計算しました,ということ.正直言って,革新的なモデルでも,実験をしているわけでもないが,ただただ根気と時間とお金がかかりそうな研究.面白い結果だけど.


果たして結果は,ラテンアメリカ(メキシカンスパニッシュとか)がポジティブ傾向が強く,サンプルの中で最も低いものは中国語のGooge Booksだったという(Fig.1).また単語間の翻訳で,同じ意味の単語がそれぞれのレーティングで幾らかをみることができるのだが,すべての間でほぼ線形な正の相関を見せる(Fig.2).翻訳してもその単語の意味自体は安定しているということ.また,文学作品では,ハピネス平均を時間窓をずらしながら時系列として表していて,ハッピーエンドなら,作品の最後に向かって盛り上がる,とかそういうのも見えて面白い(Fig.4).


今回の研究では日本語は非対象だったけれど,どうなるのかは気になるところ.また,単語のことをatoms of human languageと捉えている点も今後も期待できそうで面白い.atomだけど個性(ポジネガ)があって,と.この論文はシステム化されていてHedonometerというページで確認できる.楽しいページ.出てくる数自体の意味はちょっと眉唾だけれど,全体の傾向などは楽しめる.

*1:Kloumann IM, Danforth CM, Harris KD, Bliss CA, Dodds PS (2012) Positivity of the English language. PLoS ONE 7(1):e29484.