Tracking Traders' Understanding of the Market Using e-Communication Data
Serguei Saavedra, Jordi Duch, Brian Uzzi
PLoS ONE 6(10): e26705. (2011)


PREのレフリーから,モデル提示部分の指摘に関連して紹介された論文.
day tradersのinstant messages(IMs)でやり取りされる単語情報と,
実際のVIX*1の相関を見る.


この論文で新しいのは,あらかじめ単語情報を与えるのではない点.
統計手法を駆使しながら,232 thousand unique wordsから,de MenedezとBarabasiの手法で外的,内的要因どちらが支配的かを判断して,外的要因が支配的な459 wordsに絞り込む.
これらをさらに,任意の単語iとjのペアで相関が強いものを,z-core解析で絞り込んで3つの束(bundle)に分ける.
1つ目の束は,negative,crazy,oil,S&Pなどの組で,これは同日のvolaと相関が高い.
2つ目の束は,happy,win,bloomberg,nyseなどの組で,これは翌日のvolaと相関が高い.
3つ目の束は,英語以外の言語の束だが,これはどの時点のvolaとも相関がなかった.


この論文の結論では,volaが高いとプレッシャー(「トレードしなくては!」)が大きい,ということで,
ブログに置き換えると,プレッシャーが大きくなる(~プレッシャーの強さを決めるajが大)で,現在または未来の書き込みが増えると言えるのではないか,というレフリーの指摘.


2012.7.12追記
結論を導くための具体的な解析方法は,異時刻相関である.
1つ目の束が,VIXのvolaと同日相関,2つ目の束が,-1日の相関があった.
1つ目の束のFreq.と2つ目の束のFreq.の差をC(t)とし,volaとそれぞれz-coreになおして正負で比べると,同日相関を持つ1つ目の束が多い場合はvolaが高く,2つ目の束が多いときにはvolaが低かった.
その結果,volaが高いときには同日の情報を交換したコミュニケーションが盛ん,低いときには翌日の情報を交換したコミュニケーションが盛んである,という結論に行き着く.(結構,分かりにくい論法だ...)

*1:volatility index,別名恐怖指数といい,値が大きいほどvolaが大きく,先行き不安感を表すとされる.