NHKで面白い番組を見た.
地球イチバン「地球でイチバン大がかりな選挙〜アメリカ大統領選のウラ側〜」

地球でイチバン大がかりな選挙、それは4年に1度行われる「アメリカ大統領選」。ボランティアを含め選挙運動に携わる人、推計1000万人以上! 選挙資金は史上最大の60億ドル・約4800億円。いったいどのように行われるのか? 意外な(?)どぶ板戦術と最新鋭のコンピューター作戦の連動。「ビールや自動車の好み」から投票行動を読み解く頭脳ゲーム。「一人一人にメッセージを届ける」秘術。知られざる内実を徹底取材!


ギネスビールを飲む人は民主党(オバマ)に投票しやすい,とか,日本車などの外国製の車に乗っている人も民主党に投票しやすいとか,疑似相関かもしれないけれど,5:5よりは6:4くらいでデータからは傾向が分かる,というのは面白いと思った.
厳密にやりだしたらきりがないだろうけれど,
wikipediaによると二人の得票率はそれぞれ,50.5%と47.9%なのだから,こういうちょっとした差でも利用したいところだろう.
放送中に「Big Dataというのを駆使してー」,というくだりがあったのだけれど,そのデータの出所はまさにドブ板.
支援者が家庭を回って,インタビューをして過去に民主党共和党どちらに投票したとか,何に興味があるかとかを聞き出して,持ち帰ってデータベース化することの繰り返し.
Big Dataを使って,数学でこねくり回して,という(大方の想像)と,真逆.
で,あとは家庭訪問すべき人物を絞り込んだりして選挙戦略に活かす.なんでもすべての有権者の「オバマへの投票確率」というのを計算で出しているとか.可能だろう.
たぶん,この辺のモデル,というかアルゴリズムはかなりシンプルだと思われる.
相互作用無し,宇宙人方程式的にすべてのあり得るパラメータに重みをつけて突っ込む,的な.


放送の感想としてはBig Data万歳,ではなく,価値のあるデータというのは,もっとも入手が難しく,次に難しいのがきれいに整形することだな,と再確認した.
そのデータの入手方法はとにかく,人に話をさせて,話を聞くこと.
こういう姿勢で来られて,オバマ陣営に悪い印象を持つ人はいないだろう.だって話を真剣に聞いてくれるから.
インタビュアーも,真剣に聞いてデータ化しないといけないから,必死だろう.
それが結果的に勝利に結びついたのではないかと思った.


要は,多分こんな感じ.

データから戦略をたてて,選挙対策をしようと思った → データが無い → データは簡単に転がっていない → データを入手しに町へ出る → Yes/No式のアンケートでは必要情報がとれない → 有権者の話の中から必要情報を取り出す → 有権者,話を聞いてもらえて満足 → オバマ当選

データは重要だけれど,過信も良くない.面白い例だと思った.