10:00-19:00
ホットリンクでみっちり、いろいろ教えてもらう。
謎だらけだったクローリングの仕組みも、イメージできたし、
最近迷うことが多かった、Term FreqencyとDocument Frequency問題も、解決の糸口が見つかった。
今まで、R経由でしかできなかった日本語の形態素解析も、
自分でunixコマンドを使って、できるようになった。
#何でそこに気がつかなかったのかと思うほど、簡単だった。


共起語のマトリクスも、もう少し頑張ればできそう、多分。
マトリクスができれば、また新たな「ネットワーク」もできる。
文書集合をベクトル化することも出きるようになるし、
いろいろな可能性に気づいておもしろくて、ワクワクした。
#ただ、冷静に今すべきことからはブレない範囲で、やらないと。


どうでもいいんだけれど、いつものように、暖房の効かない
研究室に行く感じで、割とモコモコな服装で行ったら、
結構暑かった。さすが「ホット」リンク。寒。