2005/03/08 (火)
◆ PAUP*のBootstrap - 23:02:03
異様に遅いのはなんでだろう。というわけで私は「seqbootでbootstrapリサンプリング。リサンプルした各データにおいて元データから推定された最尤系統樹を初期系統樹として与えて樹形探索。結果を保存。全探索結果のコンセンサスを採る」とゆースクリプトを書いてやってます。そこそこ速くなります(笑)。しかも初期系統樹を与えることができる。PAUP*のbootstrapって樹形探索時の初期系統樹ってやっぱりNJtreeなんかなぁ? PAUP*純正bootstrapと結果がそこそこ変わるのはどう考えるべきか。個人的にはやってる内容をほぼ把握できている自分のスクリプトを信用しているんですが。
ちなみに上記のやり方は某所で配っているsite-specific rateなモデルでbootstrapをやるスクリプトでも採用してます。それを微妙にいじくってGTR+I+Gモデルでbootstrapできるように変えているわけ。他のモデルや最節約法でも使えたりする。そういや、PAUP*の最節約法でのbootstrap解析はもっと変に見えるんですけど(特に最節約樹形が複数ある場合に一つをどう選んでいるかがわからん)、あれって内部どうなっとんのやろ。
追記 - 23:44:16
そして自分のスクリプトのバグ発見。全然信用できへんやん(爆死)。修論に書いたbootstrap確率間違っとるやん(鬱死)。
◆ EU理事会がソフトウェア特許承認 - 22:19:59
EU域内で活動するソフト開発ベンダは死亡やな。Mandrakeとかどうすんのやろ。SUSEもまだドイツに開発拠点置いとるんやなかったっけ。
◆ 英辞郎 第二版 EPWING化 - 21:44:51
eijiro-fpwが使えました。ただしMakefileの一部を以下のように改変する必要あり。
SRCFILE = Path/EIJIRO81.TXT
FPWPARSERFLAGS = -c sjis ${SRCFILE}
あとは
fpwmake
してから、
fpwmake catalogs
するとエラーになる。ここでcatalogs.txtの改行コードをCR/LFからLFに変更した上で、ebutilsのcatdumpを使う。
catdump -u catalogs.txt catalogs
fpwmake catalogs
fpwmake install INSTALLDIR=.
◆ 再解析とPHYML - 18:34:47
先日GenBankでApsilochoremaのCOI〜COIIにまたがる長い配列を見つけたのでそれを外群にして再解析してみた。ま、外群にするには遠すぎるんですが、それでも一番近いので。
で、モデルは同じなのにPAUP*とPHYMLの結果が全然違うのでおかしいなーと思い、尤度を見てみるとPAUP*の方がかなり良かった。もしかしてPHYMLってNJtreeにかなり近いところしか探してない?と思ってPAUP*が吐いた最尤系統樹を初期系統樹として与えて(樹形ファイル形式が違うので変換の必要あり)計算させてみると、予想通りPAUP*とほぼ同じ結果が得られた。尤度もかなり近くなった。
ということでPHYMLは樹形探索の範囲が狭いので気をつけましょうというお話でした。多分Bootstrapも探索範囲をかなり絞っていると思われ。ちなみにTreefinderもPHYMLと同様に初期系統樹を与えるか否かで全然違う系統樹を出力してきましたので気を付けよう(Invariantをサポートしていないのでモデルは違うけど)。もちろん初期系統樹を与えた方が尤度が良かった。
PHYMLの出力を見たときはどうなることかと思った。あー良かった良かった。
◆ こんぱいる - 17:46:18
r8sをFreeBSDマシンで使えるようにコンパイルしようとしたら、libstdc++の指定が添付のMakefileに無かったためハマった。最初はつい「-lg++」と指定してしまって「libg++」が見つかりませんなどと言われて悩んでしまつたよ。「-lstdc++」を指定して解決。
◆ 宿泊予約完了 - 12:30:21
1泊¥2,100ってすごいよなぁ。
◆ ナニィーーーッ!!! [ぎょーむ日誌] - 09:37:49
くそう、前に探したときは見つからんかったぞ(笑)。