調べごとのついでにarxivにて。
Title:Detrending career statistics in professional baseball: Accounting for the steroids era and beyond
Authors:Alexander M. Petersen, Orion Penner, H. Eugene Stanley
Source:arXiv:1003.0134
メジャーリーグの成績について、時代全体のトレンドを入れて計算しなおす方法の提案。
1914年のMVPのJohnny Eversの記録は、打率(BA) は0.279, ホームラン(H)は1本、 打点(RBI)は40点。
2009年のLos Angeles DodgersのSecond Basemanである、Orlando Hudsonの記録は、
すべてにおいて(0.283 BA, 9 HR, 62 RBI)彼を上回っているが、MVPはとっていない。
だから年代で規格化しないといけないよね、と言う話。
いろいろと重み付けはしているが、要は全数で割るということで、
私がやっていた、ブログ書き込み数を全数で規格化することと似ている。


ちなみに、野球が好きだと巻末に、歴代ホームラン王とか、打率王等の記録を、規格化前後で比較した図表がのっているので、おもしろいかもしれない。
歴代ホームラン王である、Barry Bondsの記録762本は規格化すると、502本になり歴代8位に転落し、
代わりに歴代3位のBabe Ruthの記録は714本は規格化すると、1215本になりぶっちぎりの1位になる。
日本人としてうれしいのは、イチローが2004年に樹立した、1シーズン中のヒット数の歴代1位の記録は、
規格化前後でもその地位を保っていることだった。


全体のトレンドを取り除くと言う意味では、尤度を考えた、こちらの方がかっこいいし、連続的に使えると思う。
全数で割るときには、どうしても、平均を「足しあげる期間」を考えなければいけなかったりするが、
この方法だと逐次的に計算できる点で有利。
Title:Estimation of Parameters from Discrete Random Nonstationary Time Series
Authors:Hideki Takayasu and Tomomichi Nakamura
Source:Progress of Theoretical PhysicsSupplement No. 179 (2009) pp. 198-208