幾霜::残日録::2007/02/10 (土)

 

移籍先を探しています。系統樹推定法やメタバーコーディング法などに詳しい研究者を探している方がおられましたらご一報下さい。

2007/02/10 (土)

[Life] 今日はさながら - 22:26:44

多重置換の分子進化速度と分岐年代推定への影響特集状態やな。分子進化速度の推定には適切なタクソンサンプリングと見かけではなく真の枝長の推定が必要だということですな。SCaFoSのデータ作成手法は「Long-Branch Attractionを避けるために分類群内からは進化速度の遅い配列を選んで使う」というもののようなのですが、これって実際に遅いかどうかよりも多重置換が検出されやすいかになってしまう気がする。

[Life] 1箱¥1,500のティッシュ [ITmedia] - 19:58:29

 アホだ(笑)。しかし一度くらいは使ってみたい気も。1組10円で使用体験できるといいのに。

[Science] 系統樹の見かけの枝長から真の枝長を推定する - 18:35:51

 これは見かけの進化速度から真の進化速度を推定するという問題、即ち枝内での多重置換数を推定することにも直結する重要な命題でしょう。モンテカルロ法で推定するのはさして難しくはないような気がするのでどこかで既にやられているんじゃないかなぁ。

 現在の分子進化モデル&系統モデルからの配列生成に用いられているモンテカルロ法では枝内での多重置換(=検出できない多重置換)は起きない実装になっているはずです(でないとparametric bootstrapに使えない)。枝内での多重置換を認める実装をしてしまうと、実際に生成される配列から推定される枝長が与えた真の系統モデルよりも短くなってしまうからです。

 ここで、わざと枝内での多重置換を認める実装をして、枝長が真の系統モデルと一致するまで変異させるようにした上でそれに要した変異数を数え、枝内多重置換を認めない実装での変異数との差をとれば、それが多重置換数の推定値になるはず。そこから真の枝長も推定できるでしょう。これを繰り返せば区間推定もできるのでは。

 分岐年代推定も、真の枝長の推定の上に行った方が推定精度が上がるかもしれない。ブートストラップによる見かけの枝長推定のばらつき推定とも統合してやることで、区間推定精度が上がったりしないだろうか。実際には現在のMCMC分岐年代推定ってそんな実装になっていたりするのかも。

 いやしかし、少なくとも単純伸縮法に関する限りでは分岐年代推定の精度にはあまり影響しないか。そもそも与えられる枝長が見かけのものであることを折り込み済みで実装しているのだし。分岐年代推定結果から真の分子進化速度を算出する際には役に立ちそうな気がします。

追記 - 19:16:21
 別の見方をすれば現在のモンテカルロ法による配列データ生成は、「枝内の多重置換が無い」という非現実的仮定下にあるため、何らかの手法の良さを示すためのシミュレーション用には向いていないと言えるのかもしれない。

追記 - 22:32:17
 上のやり方だと推定に用いるモデルが見かけの枝長に基づいているからまずいな。そうするとモデルの改善とモンテカルロを繰り返す・・・ってMCMCか。分岐年代推定時に出力される分子進化速度の推定値はそういう補正済みの値になっとるんだっけか?

[Science] Clade Age and Not Diversification Rate Explains Species Richness among Animal Taxa - 11:46:15

 こんな低レベルな解析でアメナチュに載るのかという驚きの1本。分岐年代推定の一つはMean Path Lengthと2.3%/1Myという既知の分子時計を使用したもの(対象分類群に注目)。こんなの私なら恥ずかしくてできませんよ。もう一つの化石を用いた推定も仮定がすごい。それと種分化速度と分子進化速度を混同しているように見受けられる(これはさすがにわざとか)。

 そもそも問題設定の時点で必ずこういう結論に至るように設計されている。この論文の価値が全く理解不能。

追記 - 18:10:44
 そうか、種分化速度と分子進化速度は一致しなさそうだということを現実のデータに基づいて示した例は記憶に無いな。これまでの研究は両者がリニアな相関関係にあると仮定していたはずだ。そういう観点からすれば確かにそれは検証すべき問題だ。しかし、そのための手法がお粗末すぎる。

追記 - 22:32:17
 無いわけ無いな。分岐年代推定している研究を見ればその問題の検証になっているものもある。

[Science] Detecting the Node-Density Artifact in Phylogeny Reconstruction - 09:53:39

 タクソンサンプリング密度が高ければ高いほど、最節約・最尤・ベイジアン系統推定における多重置換検出率は上昇する。つまり、タクソンサンプリングが粗な分類群と密な分類群では枝長の推定精度が異なる。多重置換検出率が低ければ低いほど「見かけの進化速度」が遅くなり、逆は速くなる。ここで、現在の系統推定法では進化の速い分類群どうしが引きつけ合うLong-Branch Attractionという効果が知られている。故に、密にサンプリングされた分類群では多重置換がよく検出されて進化が見かけ上高速になり、そのような分類群どうしがLong-Branch Attractionによって引きつけ合う効果が生まれる。これが系統推定を誤る原因になり得る。

 この問題はあまり認識されていないんじゃないかと思っていました。私はこれをThick-Clade Attractionと勝手に心の中で名付け、この効果が系統推定を誤らせている事例が実は結構あるんじゃないだろうかと考えそれらしく見える事例を集めていたりしたんですが、昨年のSystematic Biologyに検出方法に関する論文が載っていたとは。見逃していました。あー無念。1年遅かったか。

追記 - 09:59:08
 っつーか検出方法自体は2003年に発表されてたのね。4年遅れとるやん。むきー。

[Science] 統計数理 - 09:28:33

 全文PDFで公開されているんですね。非常にクオリティの高い日本語の論文がこんなにもたくさんタダで読めるなんて。

[Science] Kjer哺乳類ミトコン系統樹論文 - 09:21:20

 またしてもちょー汚くて使いにくいNEXUSデータですなこれは。読み込むだけで解析が実行できる形式でもデータを用意しておいて欲しいんですけど。領域ごとに核酸はGTR+Gだそうです。モデル選択はしていません。系統樹見るとよくこのクオリティで通すなぁと感心します。いやまぁ信頼性の低い部分は議論の対象としていなければいいんですけど、これで過去の研究の系統樹と似ている似てない言われても反応のしようがない。

[Science] First International Conference on Phylogenomics - 08:26:39

 BMC Evolutionary Biology特集号。SCaFoS論文PhyloBayes論文コドン置換モデル選択論文は読まないといけませんね。

追記 - 18:43:20
 DOIデータベースが狂っとるせいでリンクで直接論文に飛べませんね。まぁそのうち修正されるでしょうからリンクは放置。すぐに読みたい方はタイトルのリンクからなら正常にたどれるはずですのでそちらから。

[Life|Science] 発進 - 05:24:30

 っつーことで西方へ飛ばす。送ってから既に今週の業務があっちでは終わっていることに気付く。あー月曜になってから送ってもいっしょやん。もういいや。とりあえず返信が来るまで見直しはしないことにしよう。

[Topics] 柳沢厚労相「健全」発言について - 05:14:21

 希望調査結果をふまえた発言としても不適切だと思う。集団のペア当たりの平均産子数が2前後であることを指して「その集団が健全」と言うのは集団の存続可能性の観点から見てOK(ただし現在の日本の人口は大きすぎると思うので2を大きく下回っていても直ちに不健全とは言えない)。しかし、「希望子供数」という「願望」が平均2以上なのを健全とか不健全と言うのは個人的にはアウト。願望を指して言っているため言及対象が集団というよりも個体という感が出てきている。しかし逆は真というわけではない点は少々可哀想ではあるが大臣として配慮不足なのも確か。

 そもそも、「産めよ増やせよ」の発想が未だにあるのが問題ではないでしょうか。別に減ってもいいじゃないかというか、自然環境への負荷を考えれば明らかに今の人口は大きすぎる。人口減時代にも社会構造を変えればいくらでも対処可能でしょうに。厚生労働省は人口が減ったら自分のところの利権が減るでしょうからその発想を捨て去ることは永遠に不可能なのでしょう。中央省庁の出す政策が全て国民ではなく自組織の存続・利権拡大を第一に考えられたものになってしまうのをまずは防ぐ必要があるのでは。

 そのためには省庁間の人事異動がガンガン起きる・起こすようにすべきではないでしょうか(って何度も話は出ているはずなんですが)。しょっちゅう異動してればどこの組織の利権拡大に努めればいいのか的が絞れなくなるでしょう。ある程度習熟に時間のかかる業務もあるでしょうけど、民間企業で大きな問題は起きていないんですからほとんどの業務では省庁間で職員の異動があってもさほどの支障はないと思いますし。現在の省庁間・地方中央間の人事交流はほとんど「出向」であってあくまでホームは固定のはずですよね。こういう話はずいぶん前からあるはずですが、ちゃんと進展しているんだろうか。

追記 - 18:05:50
 柳沢発言に対する政治家・マスコミによる批判はほとんど政争の具にするための言いがかりだというのはその通りでしょう。現在の減少傾向は急すぎてもっと緩やかにする必要があるという点にも同意します。そのためにも、とりあえず厚生労働省と大臣はまじめに生みやすい環境整備をやっていただくしかないですね。まずは産婦人科医不足の解消と産休を取りやすくすることでしょう。

[Science|Software] シーケンスファイルの連結はけっこうめんどくさい - 04:18:22

ということに今更気付く。角さんは今のところ連結済みのシーケンスファイルを用意して、コマンドラインオプションにパーティション設定を記述しなければならない。しかし、パーティションごとに分かれたシーケンスファイルをコマンドラインオプションで入力ファイルとして指定してファイル名(拡張子除く)をパーティション名にするようにすれば、予め連結したファイルを作成する手間もコマンドラインオプションでパーティション設定を与える手間もかからない。ファイル内のシーケンスの長さからパーティションの区切りも計算できる。うーむ、いずれ付けるか。

追記 - 2007/02/14 17:23:30
 Mesquiteにデータを読み込んで、Matrix Windowにて「Matrix」メニューの「Utilities → Concatenate Other Matrix」で簡単にデータを連結することができる。けどやっぱ上記の機能は付けた方が良いでしょうね。

Go to front page
Comments and TrackBacks
Web antenna system: NaTsuMi
Search in this site
Access Count : 1990490