2006/08/21 (月)
◆ [Life] 世の中にはすごい人がいるんだなぁ - 21:34:19
自分達が正しいことをやっていると思いこんでいるバカに付ける薬が開発されたらノーベル賞モノだ。っつーかなんでケナフなんて推奨すんのよ。ケナフが有用かどうかは問題ではなく、地元の他のモノよりもデメリットを凌駕するメリットがあるかどうかが問題なんやないか。とりあえず子供達への洗脳は防がねばなるまい。早めにケナフの特定外来生物への指定もした方が良いかも。ワケのわからんNPO法人の規制も必要ではないでしょうか。
◆ [Life] 誰か止めたれよ・・・ - 16:40:46
もう哀れとしか言いようがない。某Eの付くMLの話ね。
◆ [Life] 早稲田実業優勝おめでとう - 15:02:43
最後まで良い試合でした。9回の表になったときにはもっとあっさり終わるかと思いましたが駒大苫小牧も流石でした。マウンド上では最後まで全く表情を変えなかった斎藤が優勝後に泣いているのが最も印象に残りました。あー生きてて良かった。
◆ [Life] 早稲田実業の斎藤は凄い - 13:26:27
なにあの球速。コーナーを突く投球。コントロールは松坂より良いかもしれない。
◆ [Science] モデル間の多重比較 - 07:25:23
ベストモデルとその他モデルとの比較は多重検定になるのですがどうしましょうねぇ。沓掛さんの『動物行動学者のための一般化線形混合モデル入門』ではpがどうこうとしか書かれてなくてどういう手順でやっとんのかよーわからん。っつーかこの説明は微妙に意味不明だ。階層化尤度比検定とAICによるモデル選択が混じってないか? 文面通りに受け取ると、一番複雑なモデルから階層化AIC有意差検定とでも言うべき方法で有意な差が検出されるまで単純化していく感じなんですが(その検定法もよく分からん)、一番複雑なモデルと2番目に複雑なモデルで有意な差があっても、実は一番単純なモデルが圧倒的に小さいAICを有していることはあると思うんですけどそれは無視するんでしょうか。私なら絶対そんなバカな方法使いませんが。謎だ。
じゃぁお前はどないすんねんっつーことですが、今考えているやり方ではとりあえずAICベストモデルを選び、そのモデルと同じかよりパラメータ数の多いモデルはこの時点で検討対象外にし、残ったモデルの中でAICが一番近いモデルとAICベストモデルでAICの値に有意な差があるかをブートストラップWilcoxon符号化順位検定。有意な差が検出されたらAICベストモデルを選択して終了。有意な差が検出できなければ、AICが2番目に近いモデルでも同様の検定(ただし多重検定なので有意水準は半分にする)。有意な差が検出されるまでAICベストモデルと残りのモデルの比較を繰り返す(繰り返す度に有意水準は半減)。このようにして有意な差が検出される直前の組み合わせのAICベストじゃない方を選択する。そんな感じ。
追記 - 09:47:41
あ、「直前の組み合わせのAICベストじゃない方」ではあかんやん。AICベストと有意な差が無い範囲で一番遠いのを選ぶ意味は無い。そうやなくて、その範囲の中で一番パラメータ数が少なくてAICベストに近いやつを選ばないと。
追記 - 10:24:43
嗚呼なんてマヌケ! 有意水準は半減やないやん。2回目で1/2、3回目で1/3、n回目で1/nだった・・・。
追記 - 12:23:48
比較の結果、有意な差が検出されなかった場合、そのモデルと同じかよりパラメータ数の多いモデルは以後検討対象外にする、という手順も入れないと。
追記 - 15:42:43
上記の方法はあくまで系統解析における分子進化モデル選択用の話で、通常のケースではWilcoxonの符号化順位検定を使う必要は無いと思います(使ってもいいけど)。むしろKishino-Hasegawa検定・Shimodaira-Hasegawa検定やマルチスケールブートストラップを用いた近似的に不偏な検定などの方が良いでしょう。Wilcoxonの符号化順位検定を挙げたのは、系統解析が分子進化モデル選択と系統モデル選択の二重モデル選択になっていることと、近似的に不偏な検定をAICcやBICで行おうとする際に補正項をどうすればいいのかよくわからないためです。
◆ [Science] 2006年度統計関連学会連合大会 - 07:03:09
イマイチ「キター!」っていう感じで惹かれる講演が無さそうな感じですが学生事前申込み¥1,500と安いのでとりあえず申し込んでおきました。懇親会は当日との差額が小さいので当日決めることにしました。今日〆切なのでまだ申し込んでない方はお急ぎ下さい。
あーそうそう、M中セソセイ、きゃりっこ亭逝きましょう。
◆ [Science] Wilcoxonの符号化順位検定 - 06:46:01
モデル間で情報量規準に有意な差があるかをWilcoxonの符号化順位検定(+ブートストラップ)で行おうとすると、厳密なpの計算をするにはペア数が増加するとすごい時間がかかる。だいたい16ペアくらいが限界。17以上になると倍々ペースで計算時間が増加する。ブートストラップのレプリケート数を大きくすると事実上正規分布による近似計算を行うしかないですねぇ。まぁしょうがないか。
◆ [Science] 塩基置換モデル選択に検定は必要か - 04:09:38
うーん、単純に情報量規準最小化するんでなくて、ベストモデルから1つパラメータの減ったモデルのなかのベストと比較して有意な差があるかどうかって考えるべきかね。有意でなければパラメータ数の少ないのを使う、ってやつ。まぁブートストラップを実装済みなんでそれをやることはできるんですが(ブートストラップは元々モデル選択結果からの樹形依存性の排除を目的としている)。樹形を固定してRELLという手もあるでしょうねぇ。
◆ [Science] REMLってナニ? - 03:45:27
よーわからん。
_ 橘 [van de Wiel (2001)のsplit-up algorithmというもっと速いアルゴリズムがあるようです。特許関連で問題が無ければ実装を検討してみます。]
_ 福岡在住 [(1)Streitbergとかのアルゴリズム(たしかshiftアルゴリズムという名前)はだめでしょうか。(2)学外(兵庫県山中、本当に山中)からなので、すぐ見つかりませんが、他にも全部調べるより速いアルゴリズムはある可能性が大きいと思います(ときどき特許がうるさいのがある)。(3)すごく小さなPが必要ならだめですが、全組み合わせが一定数をこえたら乱数に切り替えるようにする、といったことをすぐ思いつきました。]
_ 橘 [いえ、ごくごくフツーのやつなんですけど。Perlだと厳密にpを算出する処理は組の数が20以上になるとかなり待たされるんです(10秒以上)。Cで実装すればもっと大きな数でも高速に処理できるようですが。あれ、なんか変なこと言ってますか?]
_ 福岡在住 [私も状況があまりよくわかっていないのですが、Wilcoxonの符号化順位検定は、普通のそれではないのですよね(普通のなら、そんなに計算量が多くないはず)。検定されている量(これが何かわからなくてすみません)は、Wilcoxonの符号化順位検定にかかる(符号検定でなくてはだめ、ということはない)ものであるのは大丈夫なのでしょうか。(兵庫県山中より)]
_ 橘 [いえいえ、私が言っているのは「MLでの」行動よりも(それもありますが)、愚行それ自体を止めてやれる、彼を無限の迷宮から救い出してやれる人はいないものか、ということです。]
_ leeswijzer [> 誰か止めたれよそれはワタシ? ずっと放置しているのですが,これ以上「環境」が悪化しそうなら解毒します.]
_ 橘 [マルチスケールブートストラップとAU検定の考え方はここでも応用可能だとは思いますが、実際の有意確率の計算方法がまだよく分かってないのでとりあえず自分で理解できる範囲の実装を考えるとこうなった、ということです。系統モデル依存性云々というのは、分子進化モデル選択の際にどうしても系統モデルを固定する必要があり(多重モデル選択)、その固定する系統モデルによって異なる分子進化モデルが選択されうるので、ブートストラップ法を用いてデータと、データから生成されるモデル選択に用いる系統モデルをばらつかせることである程度分子進化モデル選択において用いる系統モデルへの依存性を軽減することができるだろう、というものです。]
_ K保 [回答ありがとうございます.岩波・統計科学のフロンティア 3 「モデル選択」の下平さんの章と,Shimodaira & Hasegawa (1999) をざっとながめただけであまり自信がないのですが……どうやら,ご指摘のように SH 検定はパラメーター数が変化しない場合の手法かもしれませんね.岩波フロンティア本では,Kishino-Hasegawa 検定を多重モデル比較に使うと false positive になり,SH 検定は多重性を考慮しているのだけど false negative になるので,さらにマルチスケール・ブートストラップ法を使うと適切な範囲が選べるというハナシの流れになっており(参考) http://www.is.titech.ac.jp/~shimo/multiboot-j.html本のほうではこの手法は系統樹以外にも適用されています (ただしパラメーター数が異なるモデルを比較するときは AIC の定義を補正する必要がある).系統モデル依存性ないモデル選択,の部分はよく理解できていません.すみません.私のこのうだうだとした書き込みの背景は・自分の仕事がススんでいない状況で霜月さんのサイトを見た・前から気になってた AIC 多重比較について不安感かきたてるエントリーが・それがきっかけで統計学文献ながめる現実逃避に走った (そして改めてこのあたりの多重比較は難しそうだと思った)といったきわめて利己的なものです.おさわがせして恐縮です.おとなしく仕事します.]
_ 橘 [>K保セソセイここで考えているのは分子進化モデル間のAIC差の検定であって、系統モデル間のAICの差の検定ではありません。Shimodaira-Hasegawa検定は比較モデルが互いに包含関係にないことを前提としているはずですから、ここでは適用できないのではないかと思います。それと、これはAICの差(生データでの推定結果から得る)をAICの差の分散(ブートストラップで得る)で割った値を検定統計量としますが、「AICの差」は系統モデルを固定しなければ得られません(系統モデル間の比較では分子進化モデルを固定する)。それでは当初の目的であるモデル選択結果からの系統モデル依存性の排除ができません。]
_ leeswijzer [> きゃりっこ亭逝きましょうハイ,もちろん逝きましょう.懇親会は出る時間がないので,「きゃりっこ亭」でキマリ! ※おお,〈十四代〉が待っている~.]
_ K保 [状況よくわかっていないし, このあたりぜんぜん詳しくないのですが…… まさに系統樹の「AIC の差の検定」をあつかう Shimodaira-Hasegawa 検定を使わないのはなぜでしょうか?]