震災データのレコード数.毎日ほぼ2500万ツイートある.

 26100368 2011-03-11.txt
 27316110 2011-03-12.txt
 23065989 2011-03-13.txt
 25405084 2011-03-14.txt
 25339259 2011-03-15.txt
 24369068 2011-03-16.txt
 22466126 2011-03-17.txt
 5224293 2011-03-18.txt


時間をシリアル秒に直して,1分単位の周期を確認する.
awkのintは整数部分の切り出し.四捨五入ではない.

awk -F":" '{x=$1*(60*60)+$2*(60)+$3;y=int(x/60);z[y]++}END{for(i in z)print i,z[i]}' 2011-03-12.txt | sort -k1n > Circadian12.txt