2012-01-01から1年間の記事一覧

お買い物 50万まで.新聞データベース 13万円くらい. http://www.nichigai.co.jp/sales/corpus.html日経サイエンスデータベース 10年分合わせて5万円くらい. http://www.nikkei-science.com/52301.html

R R

ベクトル要素の最後に数字と付け足す. w=NULL for(i in 1:10){ v=1 w = append(w, v,after=i) }他に何かいい方法がありそうなのだけれど,とりあえずこれでも処理可能.

採択した論文の著作権についてもめる.始め1700ドルの請求が来た.画面にもOpen Accessとある. Sci.Rep.とかPRXみたいなOpen Accessの設定をしたのかと思い, APSオフィスにOpen Accessじゃないのでお願い,と連絡. すると,Author feesが0ドルになった.…

アカウントの乗っ取りが流行しているというので,Gmailを二段階認証に. 意外と手間がかかったのでメモ.基本的に携帯電話がないとできない.アカウント>セキュリティ>二段階認証プロセスの編集画面 携帯電話のメイルアドレス,電話番号を設定.次にログイ…

大規模データ,比較的手が届くもののリスト. Wikipediaのダンプデータ 日本の統計サイト, e-Satマクロなやつ多し. TwitterのAPIを使って自分で集める. Mathematica提供のデータを使う.(Mathematicaのライセンスは必要.) NewmanグループのNetwork data…

金子書房主催のPOMS(Profile of Mood States)セミナー. POMSは元は第二次世界大戦後の服役軍人の薬物療法の効果測定のため,作られた. 日本では1994年に金子書房から発行された. 65項目あって,それを6つの尺度で測る.6つの尺度は,ストレス反応の結果引…

R R

Rで階乗の計算は,例えば5!ならば以下. gamma(5+1)普通階乗のn!におけるnは非負整数だったが,これを複素数含む一般の形にしたものがガンマ関数. n!=gamma(n+1)だから,0!=gamma(1)=1 と考える.ガンマ関数の定義式(x>0)は,18世紀(1729?)にオイラーによっ…

40分Talk+20分質疑応答,311のデマ関連について.デマと流行の違いって,うまく応えられなかった. デマは不安な時に出まわるのに,流行は不安ではなくても出まわるのはなぜ,という質問. または,血液型占いは,明らかな「デマ」なのにこんなにも流行して…

中央値 print StatsMedian(wave4)

eps以外の図を取り込む.例えばmacのスクリーンショットはpngなので,それを取り込みたい場合. %プリアンブル \usepackage{graphicx} %取り込み \begin{figure}[htbp] \includegraphics[keepaspectratio=true,width=50mm,bb=0 0 750 780]{./screen1.png} \n…

自分のセミナー.90分授業の60分Talk+30Discussionのはずが,70分くらい話してしまった. それでも途中のベキ発散の詳細は,飛ばしたくらい.質疑応答が未だに苦手だ.身構えすぎるのだろうか. デマvs歯がゆい,でどうやってその正当性を評価するのかと,逆…

ランダムシャッフルしたデータ同士の相関で,データポイント数が58ポイントで,相関は0,その標準偏差が0.13というのは自明な解なんだろうか.1780サンプル近く,全部そこに収束している.計算でできるかな.ZeroSanoのID番号は74949430.

久しぶりに,printfの書式. awk -f Multiple.awk AdverbNumbers.csv ./TimesHour/Corr_LogDiff_Rand.csv | awk '{if($4>($5+$6) && $3>1 )print $0}' |sort -k4gr | head | awk '{printf("%.2f %.2f \n",$5,$6)}'

「最近の若い人は・・・」という話は好きではないが,ふとそういう話になった. インターネットが十分普及した現在は,10年以上前に大学生だったわれわれに比べ,アクセスできる情報量が途方もない.なのに,なぜもこんなにデキがよくないのかと. 微分方…

Vox Populi Sir Francis Galton Nature 75, pp. 450-451 (1907) よく引用される,ゴルトンの集合知の論文.平均値なのか,中央値なのか. ちなみに,タイトルの意味は,(しばしば the vox populi) 人民の声,世論.[ラテン語 ‘people's voice' の意]という…

増田さんの数理生物学会賞の受賞記事を読ませてもらった. 人間の社会行動に興味があるので,今後の計画は社会科学に何らかの方法で深くコミットすることである. 社会学は,社会ネットワークが絡むものも絡まないものも含めて,先人が出した大きなパラダイムが…

うわさとデマ ニコラス・ディフォンツォ (著)/江口 泰子 (翻訳) 原著は, The Watercooler Effect: A Psychologist Explores the Extraordinary Power of Rumors Nicholas DiFonzo ロチェスター工科大学心理学部教授.2008年1月に原著の初版. うわさという…

ツイッタ+噂の伝播で文献サーベイgoogle scholarでrumor+twitter検索でトップに出て来た. 1. Rumor has it: identifying misinformation in microblogs twitter上での噂の分類,content-baseか,network-baseかmicroblog-specific memesか. 有名なツイッ…

Modular networks of word correlations on Twitter Joachim Mathiesen, Pernille Yde & Mogens H. Jensen Scientific Reports 2, Article number: 814 (2012)同一著者らのThe emergence of complex patterns in online human communicationの論文だと思われ…

スモールワールド・ネットワーク―世界を知るための新科学的思考法/Duncan J. Watts (原著), 辻 竜平 (翻訳), 友知 政樹 (翻訳) 2004年に出版されている本を久々読み直した. 大学院を「ネットワークの違いがダイナミクスに与える影響」で修士論文を書いて卒…

明日をどこまで計算できるか?――「予測する科学」の歴史と可能性 デイヴィッド・オレル予想する科学の過去,現在,未来を概観できた. 筆者は数学者で,モデル誤差の研究を博士課程の時に始めた. 指導教官のレニー・スミスは研究テーマとして,モデル誤差を…

mecab辞書から,いろいろな書き込みパターンの「歯がゆい」を抽出. awk -F"," '{split($14,x,"/");for(i in x)print x[i]}' jisyo.csv | sort -u | awk '{print "../command.sh",$1,NR}' > ~/Dropbox/DataCollectionAPI/Matome.sh

Science Updateのネタより. ミツバチは始めは保育士として働き,ワーカーとしてえさを探しに行き,戻ったらまた保育士として働くらしい. 科学者たちは,ハチの脳のDNAを解析して,このリバーシブルな後成的(epigenetic)変換に150の遺伝子が関わっているこ…

久しぶりにmecabの標準辞書をDLして確認した.過去の自分の作業を検証するため. IPA 辞書(推奨)をサイトからDLした. 中に,Conjunction.csvとか品詞別に辞書がある. 形容詞はAdj.csvで,全部で27210項目あるのだが,これは各形容詞の活用形(仮定,過去形…

連想配列を駆使してデマツイートした人たちの全ツイートを抽出. for i in `ls | grep ^2011-03-1`;do echo $i;awk -f Multiple2.awk Member_Dema.txt $i >> MembersTweet_Dema.txt;done;んで,Multiple2.awkの中. BEGIN{ FS=" "; } FILENAME == ARGV[1]{ #…

震災データ. デマツイートをした人の内訳. 1 36426 2 1670 3 158 4 31 5 10 6 2 7 1 8 1 9 4 11 1 13 2 14 3 Total 3830995%の人が1回ツイートのみ.

東日本大震災ワークショップのデータ利用規約.Twitter Upon the conclusion of the Workshop , you may publicly display and/or showcase (e.g., on a blog, website, or at a conference) your Experiment for noncommercial purposes for up to three (3…

桃李言わざれども下自ずから蹊を成す 李広は清廉な人物であり、泉を発見すれば部下を先に飲ませ、食事も下士官と共にし、全員が食事を始めるまで自分の分には手をつけなかったという。 後に司馬遷はこの人柄について触れ、「桃李言わざれども下自ずから蹊を…

python+mecabで4千万ツイートくらいの形態素解析をしていたら,segmentation faultがでて落ちる. いつも同じ箇所(43万行目)で落ちる,ファイルを変えると同じように43万行目の場合と,78万行目で落ちる場合があった. pythonで,行の形態素解析かける前に,…

ツイッターで,返信マークの「@ZeroSano」みたいなのを削除する. gsub(/^@+[ -~]*/,"",$1); @から始まる連続した半角英数を削除している.