2012年01月17日

Predictive AIC

午前中、昨日のポスターの確認を共著者間で了解がとれたので、提出。
その後お昼ご飯まで次の論文のネタに頭を悩ます。途中論文読み。

午後、次のネタを考えるうえでの参考文献を読む。
Modification of AIC-type criterion in multivariate normal linear regression with a future experiment. Kenichi Satoh. Hiroshima Math. J. Volume 30, Number 1 (2000), 29-53.

AICというモデル選択の基準がある。しかし、AICは共変量が取りうる値の範囲が、データが得られたときと、未来の予測をするときで一緒である場合に、良いモデルを選ぶ。著者らは、データフィッティングのときと未来の予測のときで共変量の取りうる範囲が変わる、言いかえると、(回帰的)外挿をする場合でも予測出来るPredictive AIC (PAIC)という規準を開発した。

この論文は、そのPAICをさらに改良する、という話だが、今日分かったのは、PAICまで。っていうか数式難しすぎ。途中、プログラミングのための線形代数という本を読んで、行列の勉強をし直す始末。大変直観的に分かりやすいし、文章も僕みたいなエセ理系には分かりやすい。



要はPAICは、AICcの拡張版みたいである。本文中では、CAICと表記されているが、定義を見るとおそらくAICcのことだと理解。AICcはサンプルサイズが小さいときのAICの改良版である(と理解している)。北大の久保さんのサイトによると、誤差が正規分布のとき以外にはおそらく意味がない補正だろう、と書かれている。何故なのか気になる。例えばこの論文では、誤差がポアソン分布だが、AICcを使ってモデルを比較しているように読める。

まぁとにかく、この論文中だと、PAICは、得られたデータと未来のデータセットが同じ場合は、AICcと同じ値を返す。またその定義から、現在のデータセットに対して未来のデータセットのサンプルサイズと平均値が大きいと、大きな値を返す(と理解)。少数のデータセットで推定した回帰式を、大規模データに外挿したり、得られたデータセットと全く異なるレンジのデータセットを予測に使おうとするときに、ペナルティを与える仕組みのようだ。
個人的には誤差がポアソン分布のときの、PAICが知りたい。僕の頭では導出するのは難しそう。

その後、休憩時間に同室の方に回帰分析と検定を教えてみる。
夕方、速読の本を速読。視野を広くとる、というのはやりやすいかもしれない。



夜、後輩が行くということでGCOEの飲み会に参加。
お世話になった事務の方にごあいさつ。今まで本当にありがとうございました。
ついでにボスにシベリア行きを改めて報告。今からわくわくする。
ラベル:統計学 数学
posted by しばきん at 21:54| 神奈川 ☁| Comment(2) | TrackBack(0) | 研究生活 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
AICcのとこ,別で気になって調べたら,辿り付きました。Burnham and Andersonのモデル選択本では,While AICc was derived under Gaussian assumptions for linear models (fixed effects), Burnham et al. (1994) found this second-order approximation to the K-L distance to be useful in product multinominal models.と書いてあります。なんか分かったら教えてください。
Posted by IWSK at 2012年02月01日 19:07
コメントありがとうございます。
Burnham et al. (1994)ですが、どうやらうちの大学からは落とせないようです。紙媒体でもないようですし。また時間のあるときに調べてご報告致します。
Posted by しばきん at 2012年02月02日 13:26
コメントを書く
お名前: [必須入力]

メールアドレス: [必須入力]

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。