Supertree (Phylogénie)

Un article de Wikipédia, l'encyclopédie libre.

Un supertree est un arbre phylogénétique unique assemblé à partir d'une combinaison d'arbres phylogénétiques plus petits, qui peuvent avoir été assemblés en utilisant différents ensembles de données (par exemple morphologiques et moléculaires) ou une sélection différente de taxons[1]. Les algorithmes Supertree peuvent mettre en évidence les domaines dans lesquels des données supplémentaires résoudraient le plus utilement les ambiguïtés[2]. Les branches d'entrées d'un arbre supérieur doivent se comporter comme des échantillons de l'arbre plus grand[3].

Méthodes de construction[modifier | modifier le code]

La construction d'un supertree grandit exponentiellement avec le nombre de taxons inclus. Par conséquent, pour un arbre de toute taille raisonnable, il n'est pas possible d'examiner tous les supertree possibles et d'évaluer son succès à combiner les informations d'entrées. Les méthodes heuristiques sont donc essentielles, bien que ces méthodes puissent être peu fiables, le résultat extrait est souvent biaisé ou affecté par des caractéristiques non pertinentes des données d'entrées[1].

La méthode la plus connue pour la construction de supertree est la représentation matricielle avec parcimonie (MRP pour Matrix Representation with Parsimony) dans laquelle les arbres qui sont source d'entrée sont représentés par des matrices avec 0s, 1s et ?s (c'est-à-dire que chaque bord de chaque arbre source définit une bipartition du jeu de feuilles en deux parties disjointes et les feuilles d'un côté obtiennent 0, les feuilles de l'autre côté obtiennent 1, et les feuilles manquantes obtiennent ?). Les matrices sont concaténées puis analysées à l'aide d'heuristiques pour une parcimonie maximale[4]. Une autre approche pour la construction de supertree inclut une version à maximum de vraisemblance du MRP appelée "MRL" (représentation matricielle avec vraisemblance et matrix representation with likelihood en anglais), qui analyse la même matrice MRP mais utilise l'heuristique pour un maximum de vraisemblance au lieu d'une parcimonie maximale pour construire le supertree.

La distance Robinson-Foulds est la plus populaire car il y a de nombreuses façons de mesurer la similitude d'un arbre secondaire avec les arbres d'entrée. Il s'agit d'une métrique pour le nombre de clades des arbres d'entrée qui sont conservés dans le supertree. Les méthodes d'optimisation de Robinson-Foulds recherchent un surpertree qui minimise les différences totales (additionnées) de Robinson-Foulds entre le surpertree (binaire) et chaque arbre d'entrée[1].

Une innovation récente a été la construction de supertrees avec un maximum de vraisemblance et l'utilisation de scores de probabilités «en entrée» pour effectuer des tests de deux supertrees[5].

Les méthodes supplémentaires incluent la Min Cut Supertree approach[6], la Most Similar Supertree Analysis (MSSA), la Distance Fit (DFIT) et la Quartet Fit (QFIT), implémentées dans le logiciel CLANN[7],[8].

Application[modifier | modifier le code]

Des supertrees ont été construits pour produire des phylogénie de nombreux groupes, notamment les angiospermes[9], eucaryotes[10] et les mammifères[11]. Ils ont également été appliqués à des problèmes à plus grande échelle tels que les origines de la diversité, la vulnérabilité à l'extinction[12] et les modèles évolutifs de structure écologique[13].

Bibliographie[modifier | modifier le code]

Références[modifier | modifier le code]

  1. a b et c Bansal, Burleigh, Eulenstein et Fernández-Baca, « Robinson-Foulds supertrees », Algorithms for Molecular Biology, vol. 5,‎ , p. 18 (PMID 20181274, PMCID 2846952, DOI 10.1186/1748-7188-5-18)
  2. « Supertree: Introduction », genome.cs.iastate.edu
  3. Gordon, « Consensus supertrees: the synthesis of rooted trees containing overlapping sets of labeled leaves », Journal of Classification, vol. 3, no 2,‎ , p. 335–348 (DOI 10.1007/BF01894195)
  4. Mark A. Ragan, « Phylogenetic inference based on matrix representation of trees », Molecular Phylogenetics and Evolution, vol. 1,‎ , p. 53–58 (ISSN 1055-7903, PMID 1342924, DOI 10.1016/1055-7903(92)90035-F)
  5. Akanni, Creevey, Wilkinson et Pisani, « L.U.St: a tool for approximated maximum likelihood supertree reconstruction », BMC Bioinformatics, vol. 15, no 1,‎ , p. 183 (ISSN 1471-2105, PMID 24925766, PMCID 4073192, DOI 10.1186/1471-2105-15-183)
  6. Semple, « A supertree method for rooted trees », Discrete Applied Mathematics, vol. 105, nos 1–3,‎ , p. 147–158 (DOI 10.1016/S0166-218X(00)00202-X)
  7. Creevey et McInerney, « Clann: investigating phylogenetic information through supertree analyses », Bioinformatics, vol. 21, no 3,‎ , p. 390–392 (ISSN 1367-4803, PMID 15374874, DOI 10.1093/bioinformatics/bti020, lire en ligne Accès libre)
  8. C. J. Creevey et J. O. McInerney, Trees from Trees: Construction of Phylogenetic Supertrees Using Clann - Springer, vol. 537, Humana Press, coll. « Methods in Molecular Biology », , 139–161 p. (ISBN 978-1-58829-910-9, PMID 19378143, DOI 10.1007/978-1-59745-251-9_7), « Trees from Trees: Construction of Phylogenetic Supertrees Using Clann »
  9. Davies, Barraclough, Chase et Soltis, « Darwin's abominable mystery: Insights from a supertree of the angiosperms », Proceedings of the National Academy of Sciences of the United States of America, vol. 101, no 7,‎ , p. 1904–1909 (PMID 14766971, PMCID 357025, DOI 10.1073/pnas.0308127100, Bibcode 2004PNAS..101.1904D)
  10. Pisani, Cotton et McInerney, « Supertrees disentangle the chimerical origin of eukaryotic genomes », Molecular Biology and Evolution, vol. 24, no 8,‎ , p. 1752–1760 (PMID 17504772, DOI 10.1093/molbev/msm095)
  11. Bininda-Emonds, Cardillo, Jones et MacPhee, « The delayed rise of present-day mammals », Nature, vol. 446, no 7135,‎ , p. 507–512 (PMID 17392779, DOI 10.1038/nature05634, Bibcode 2007Natur.446..507B)
  12. Davies, Fritz, Grenyer et Orme, « Phylogenetic trees and the future of mammalian biodiversity », Proceedings of the National Academy of Sciences of the United States of America, vol. 105 Suppl 1, no Supplement_1,‎ , p. 11556–11563 (PMID 18695230, PMCID 2556418, DOI 10.1073/pnas.0801917105, Bibcode 2008PNAS..10511556D)
  13. Webb, Ackerly, McPeek et Donoghue, « Phylogenies and Community Ecology », Annual Review of Ecology and Systematics, vol. 33,‎ , p. 475–505 (DOI 10.1146/annurev.ecolsys.33.010802.150448)