Edit Comment on
2006-08-21
n[0] = "
K保
"; m[0] = "状況よくわかっていないし, このあたりぜんぜん詳しくないのですが…… まさに系統樹の「AIC の差の検定」をあつかう Shimodaira-Hasegawa 検定を使わないのはなぜでしょうか?"; d[0] = "2006-08-21 08:35:35"; n[1] = "
leeswijzer
"; m[1] = "> きゃりっこ亭逝きましょう
ハイ,もちろん逝きましょう.懇親会は出る時間がないので,「きゃりっこ亭」でキマリ! ※おお,〈十四代〉が待っている〜."; d[1] = "2006-08-21 08:52:53"; n[2] = "橘"; m[2] = ">K保セソセイ
ここで考えているのは分子進化モデル間のAIC差の検定であって、系統モデル間のAICの差の検定ではありません。Shimodaira-Hasegawa検定は比較モデルが互いに包含関係にないことを前提としているはずですから、ここでは適用できないのではないかと思います。それと、これはAICの差(生データでの推定結果から得る)をAICの差の分散(ブートストラップで得る)で割った値を検定統計量としますが、「AICの差」は系統モデルを固定しなければ得られません(系統モデル間の比較では分子進化モデルを固定する)。それでは当初の目的であるモデル選択結果からの系統モデル依存性の排除ができません。"; d[2] = "2006-08-21 10:08:31"; n[3] = "
K保
"; m[3] = "回答ありがとうございます.
岩波・統計科学のフロンティア 3 「モデル選択」の下平さんの章と,Shimodaira & Hasegawa (1999) をざっとながめただけであまり自信がないのですが……
どうやら,ご指摘のように SH 検定はパラメーター数が変化しない場合の手法かもしれませんね.
岩波フロンティア本では,Kishino-Hasegawa 検定を多重モデル比較に使うと false positive になり,SH 検定は多重性を考慮しているのだけど false negative になるので,さらにマルチスケール・ブートストラップ法を使うと適切な範囲が選べるというハナシの流れになっており
(参考) http://www.is.titech.ac.jp/~shimo/multiboot-j.html
本のほうではこの手法は系統樹以外にも適用されています (ただしパラメーター数が異なるモデルを比較するときは AIC の定義を補正する必要がある).
系統モデル依存性ないモデル選択,の部分はよく理解できていません.すみません.
私のこのうだうだとした書き込みの背景は
・自分の仕事がススんでいない状況で霜月さんのサイトを見た
・前から気になってた AIC 多重比較について不安感かきたてるエントリーが
・それがきっかけで統計学文献ながめる現実逃避に走った
(そして改めてこのあたりの多重比較は難しそうだと思った)
といったきわめて利己的なものです.おさわがせして恐縮です.おとなしく仕事します."; d[3] = "2006-08-21 12:00:34"; n[4] = "橘"; m[4] = "マルチスケールブートストラップとAU検定の考え方はここでも応用可能だとは思いますが、実際の有意確率の計算方法がまだよく分かってないのでとりあえず自分で理解できる範囲の実装を考えるとこうなった、ということです。
系統モデル依存性云々というのは、分子進化モデル選択の際にどうしても系統モデルを固定する必要があり(多重モデル選択)、その固定する系統モデルによって異なる分子進化モデルが選択されうるので、ブートストラップ法を用いてデータと、データから生成されるモデル選択に用いる系統モデルをばらつかせることである程度分子進化モデル選択において用いる系統モデルへの依存性を軽減することができるだろう、というものです。"; d[4] = "2006-08-21 13:02:19"; n[5] = "
leeswijzer
"; m[5] = "> 誰か止めたれよ
それはワタシ? ずっと放置しているのですが,これ以上「環境」が悪化しそうなら解毒します."; d[5] = "2006-08-21 18:04:43"; n[6] = "橘"; m[6] = "いえいえ、私が言っているのは「MLでの」行動よりも(それもありますが)、愚行それ自体を止めてやれる、彼を無限の迷宮から救い出してやれる人はいないものか、ということです。"; d[6] = "2006-08-21 18:43:32"; n[7] = "
福岡在住
"; m[7] = "私も状況があまりよくわかっていないのですが、Wilcoxonの符号化順位検定は、普通のそれではないのですよね(普通のなら、そんなに計算量が多くないはず)。検定されている量(これが何かわからなくてすみません)は、Wilcoxonの符号化順位検定にかかる(符号検定でなくてはだめ、ということはない)ものであるのは大丈夫なのでしょうか。(兵庫県山中より)"; d[7] = "2006-08-21 19:11:19"; n[8] = "橘"; m[8] = "いえ、ごくごくフツーのやつなんですけど。Perlだと厳密にpを算出する処理は組の数が20以上になるとかなり待たされるんです(10秒以上)。Cで実装すればもっと大きな数でも高速に処理できるようですが。あれ、なんか変なこと言ってますか?"; d[8] = "2006-08-21 21:48:40"; n[9] = "
福岡在住
"; m[9] = "(1)Streitbergとかのアルゴリズム(たしかshiftアルゴリズムという名前)はだめでしょうか。(2)学外(兵庫県山中、本当に山中)からなので、すぐ見つかりませんが、他にも全部調べるより速いアルゴリズムはある可能性が大きいと思います(ときどき特許がうるさいのがある)。(3)すごく小さなPが必要ならだめですが、全組み合わせが一定数をこえたら乱数に切り替えるようにする、といったことをすぐ思いつきました。"; d[9] = "2006-08-21 23:26:19"; n[10] = "橘"; m[10] = "van de Wiel (2001)のsplit-up algorithmというもっと速いアルゴリズムがあるようです。特許関連で問題が無ければ実装を検討してみます。"; d[10] = "2006-08-23 05:57:50";
(password)