■
震災データのレコード数.毎日ほぼ2500万ツイートある.
26100368 2011-03-11.txt 27316110 2011-03-12.txt 23065989 2011-03-13.txt 25405084 2011-03-14.txt 25339259 2011-03-15.txt 24369068 2011-03-16.txt 22466126 2011-03-17.txt 5224293 2011-03-18.txt
時間をシリアル秒に直して,1分単位の周期を確認する.
awkのintは整数部分の切り出し.四捨五入ではない.
awk -F":" '{x=$1*(60*60)+$2*(60)+$3;y=int(x/60);z[y]++}END{for(i in z)print i,z[i]}' 2011-03-12.txt | sort -k1n > Circadian12.txt