震災データ入手.10月28日(Sun)までの短期決戦型.
申請すれば,期日の後,3ヶ月後までデータは使えるらしい.
ただし,申請は個別に行う.https://sites.google.com/site/prj311/

まず,朝日新聞とJCCとTwitterのデータを申請してDL開始.
JCCは,TVで放送されたざっくりの内容,CM内容がある.
朝日新聞は,新聞紙面で使われた記事のデータ.
Twitterは震災後1週間分の全ツイートがある.
tweet0から5まであって,現在5のみ完了.他は現在DL中.
データを扱うpythonスクリプトを公開してくれている人もいて助かる.
そんなデータのディスカッションページはこちら.https://groups.google.com/forum/?hl=ja&fromgroups#!forum/shinsaidata


特にTwitterデータに関しては三重大の奥村先生が基礎的な解析はしている.
津波が増えたとか,全体の傾向がどうとかそういうのはすべて把握できるので助かる.


それをふまえて何をするか,ですが.
新聞紙面,テレビ,ツイッターの内容の語彙の難しさ比較,とかどうでしょうかね.
新聞やテレビで難しいこと言われても分からない,だからデマに惑わされる訳で.
だったら,分かりやすい言葉で伝えるための語彙リストができたら,素敵やん.
それはこの前,まやちゃんとSkypeで話してきて出てきたアイデアなんだけど.