最大節約法

提供: miniwiki
2018/8/19/ (日) 17:45時点におけるAdmin (トーク | 投稿記録)による版 (1版 をインポートしました)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
移動先:案内検索

最大節約法(さいだいせつやくほう,Maximum parsimony)は生物の系統を解析し系統樹を作製するのに用いられる方法で、単純であるが繁用される方法である。この方法で用いられる入力データはある範囲のタクソン形質である。形質としてはある性質の有無という二分法の値(たとえば尾の有無)、あるいはゲノムの特定部位におけるDNA塩基や、タンパク質アミノ酸残基も用いられる。

系統樹を作製するための確率論的または決定論的なアルゴリズムは多数あるが、最大節約法はその答を求めるためのアルゴリズムではなく、複数の候補の中から最適な系統樹を選択するのに使う方法である。

最大節約法で用いられる系統樹は一般に無根系統樹(時間経過を考慮せずタクソン間の関係だけを示す系統樹)である。この方法で用いられるすべてのタクソンは木の中の葉に当たる末端のノードである(従ってそれに至るエッジは各1本しかない)。木の内部のノードは推定される祖先種である。各内部ノードには3本のエッジがある。各形質間の変化はいずれかのエッジに相当する。

最大節約法は、考えられるすべての系統樹の中から、形質の変化の数が最も少ない(または他のものと等しくてもよい)ものを選択する方法である。このために、すべての系統樹について、それを説明できる最小限の変化の数を「長さ」として与え、この長さが一番小さいのが最大節約系統樹である。この「一番単純な説明が一番優れている」という仮定はオッカムの剃刀による考え方である。

問題

最大節約法は非常に単純な方法でありそれゆえ繁用されるが、必ずしも正確なものではない。

古生物学に最大節約法を適用する場合の大きな問題として、2種の生物が同じ形質を共有する場合には必ずそれらが遺伝的に関係あると仮定していることがある。これは必ずしも正しくない。たとえば鳥とコウモリは羽を持ち、ワニやヒトは持たない。この表現型データに基づいて最大節約法を適用すると、鳥とコウモリ、ワニとヒトがグループを作ることになるが、ヒトは実際にはワニよりコウモリに近い。これと似た問題は、突然変異によって形質が祖先型に戻る「復帰変異」でも起きる。最大節約法は無根系統樹を用いるので、独立の前進変異と復帰変異は数学的には等価である。ただし現生の生物に関する限り、遺伝子型を決定する技術の進歩によりこの問題の重大性は減りつつある。

より根本的に重大な問題として、形質の数が少なく、比較を行う生物種によって進化速度が大きく異なるような場合には誤りをもたらすことがある(Felsenstein、1978年)。これはロングブランチアトラクション (Long branch attraction) と呼ばれ、次のような場合に起きる。

A、B、C、Dの4種を比較するとき、実際にはAとB、およびCとDが、それぞれ共通祖先から分化しているのに、AとCに対しては枝が長く(つまり進化速度が大きい)、BとDに対しては枝が短い場合、誤ってAとC、およびBとDをそれぞれ結びつけてしまう。このタイプの系統樹の場合には、多くのデータを集めるほど(多くの形質を調べるほど)誤った結論に導かれる。共通する形質を、実際には互いに無関係でありながら、誤って関係あるものと解釈してしまうためである。

この問題を克服するには最尤法近隣結合法など他の方法が用いられる。

他にも形質の数を増やすと改善されるどころか困難が増す問題がある。それは、無闇にタクソンを増やして最大節約法を使うと、NP困難問題に陥るということである。この場合に結論を得るには、近似計算、発見的方法、あるいはタクソンを一部だけに限定するといった方法をとる必要がある。

関連項目