23 gennaio 2016

Sulla probabilità della filogenesi di Theropoda ottenuta da Dave Peters

Alcune settimane fa, Dave Peters mi contattò per chiedermi una copia in formato nexus della matrice che assemblai per l'articolo sulle affinità di Balaur.
Sebbene in passato Peters non sia stato particolarmente tenero con me, e ciò per il fatto che qui e sul suo blog smentii in toto la sua personale (e pienamente infondata) ricostruzione di Aurornis (la mia smentita era basata sulla osservazione diretta dell'olotipo di Aurornis allora conservato a Bruxelles), non avevo motivi per negare una richiesta di dati pubblicati. La scienza è ripetibilità dei risultati e democrazia dell'accesso ai dati. Pur temendo un uso, diciamo, “idiosincratico” della matrice, gli inviai il file.
Recentemente, ho scoperto il motivo di tale richiesta: sul suo blog, Peters ha “confrontato” la topologia di Theropoda risultata dalla mia matrice con quella che egli ha ricavato all'interno dalla sua discutibile filogenesi dei rettili. Non mi soffermo a discutere le bizzarre argomentazioni con le quali pare “confrontare” le due filogenesi. Peters è così convinto che la sua piccola matrice sbilanciata nel rapporto taxa-caratteri (circa 3:1, quando sarebbe buona norma avere un rapporto inverso), associata alla sua soggettiva metodologia di ricostruzione scheletrica, produca dei risultati “sensati” sul piano filogenetico (nonostante sia del tutto smentita da migliaia di studi di zoologia e paleontologia) che è inutile perdere tempo in quel discorso. Allo stesso modo, è inutile rimarcare che Peters usi degli artifici matematici ingiustificati per argomentare che la topologia di Theropoda, risultata dalla matrice che gli ho inviato, sia debole e discutibile. Analogamente, se Peters ritiene che la risoluzione di un cladogramma sia un fine a prescindere dai dati, è inutile fargli notare che qualsiasi matrice costruita con un ridotto rapporto caratteri/taxa (pochi caratteri vs tanti taxa) – per giunta codificata in modo soggettivo come la sua – produce facilmente ciò che si desidere ottenere a priori.

In questo post, molto semplicemente, ritorcerò l'approccio di Peters (usato contro la mia analisi) contro l'analisi stessa di Peters, per mostrare come la sua “filogenesi” di Theropoda sia del tutto infondata.
Innanzitutto, questa è la topologia che risulta a Peters per i dinosauri inclusi nella sua analisi (immagine tratta dal suo blog).


Notate come la topologia sia del tutto in disaccordo con quanto risulta alla grande maggioranza dei paleontologi. Ciò, di per sé, non sarebbe un problema. La scienza non è dogmatica, e non pretende di avere una visione unica di un problema. Tuttavia, se la grandissima maggioranza dei paleontologi che studiano i dinosauri concorda su una topologia generale, e se tale topologia generale è basata su un secolo di dati raccolti e pubblicati, accessibili e ripetibili, è giustificato mettere un grosso dubbio sulla idiosincratica filogenesi sostenuta solo da Peters. Anche se ci sono divergenze tra gli studiosi sui dettagli, nessun paleontologo ha mai pubblicato una filogenesi così “inusuale” come quella di Peters, quindi è saggio prendere tale ipotesi alternativa con un buon tasso di scetticismo, perlomeno fintanto che sarà basata su un metodo soggettivo e non testabile come quello di Peters.
Come esempio sufficiente a mostrarvi quanto sia improbabile la filogenesi di Peters, faccio notare che, in quel cladogramma, Tyrannosaurus risulta all'interno di un clade composto da microraptorini. Anche se non siete esperti in morfologia dei coelurosauri, anche se non avete mai codificato una matrice filogenetica in vita vostra, mi auguro che riterrete altamente improbabile che Tyrannosaurus discenda da un animale di grado microraptorino, sopratutto quando altri taxa riconosciuti come tyrannosauroidi (come Dilong, Guanlong e Yutyrannus) sono anche essi presenti nella medesima filogenesi ma risultano collocati altrove nell'albero, lontano dai microraptorini.

E se questo dettaglio non vi pare sufficiente per criticare la filogenesi di Peters, e volete un qualche test matematico per misurare la probabilità che l'analisi di Peters produca una accurata descrizione delle relazioni filogenetiche di Theropoda, eccovi accontentati.

Sulla stregua della “analisi” con cui Peters ha sollevato dubbi nei confronti della mia filogenesi, ho usato Megamatrice per testare la filogenesi di Peters. Ho incluso solamente i medesimi taxa usati da Peters nella sua analisi e che fossero anche presenti in Megamatrice (unica eccezione, ho usato Ornithomimus al posto di Struthiomimus, dato che questo ultimo non è ancora incluso in Megamatrice: tale differenza di taxa non dovrebbe incidere significativamente, data la generale somiglianza tra questi due ornithomimidi: in ogni caso, la matrice di Peters non include altri ornithomimidi, quindi è ragionevole che non campioni tra i caratteri che distinguono Ornithomimus da Struthiomimus).
Ho imposto all'analisi di produrre la medesima topologia ottenuta da Peters, e l'ho confrontata con quella che si ottiene analizzando i dati senza imporre a priori alcuna topologia, per stabilire se e quanto l'albero prodotto da Peters abbia un significato filogenetico deducibile dai caratteri analizzati in Megamatrice.

La sottomatrice analizzata comprende 59 taxa. Il numero dei caratteri di Megamatrice risultati informativi per quel campione di taxa è 1073, circa nove volte quelli utilizzati da Peters. Sebbene Peters sostenga che un aumento importante dei caratteri non sia rilevante per una filogenesi (e ciò al fine di giustificare la sua matrice nella quale i caratteri sono molto pochi rispetto ai taxa), io resto della vecchia idea che l'aumento di informazione è preferibile ad una riduzione di dati, dato che al diminuire dei dati aumenta l'incidenza dell'errore di campionamento. Se ho più di mille caratteri che mostrano una variabilità nel campione, una variabilità che ritengo sia un segnale filogenetico, non ho motivo per ridurre arbitrariamente quell'insieme di caratteri. Anzi, tale riduzione di informazione avvicina maggiormente il mio risultato alla pericolosa soglia della mera casualità (il produrre alberi puramente arbitrari prodotti da un piccolo pacchetto di dati scelti più o meno a caso).

Ecco cosa ho ottenuto.
Imponendo la topologia risultata a Peters, si ricava un albero lungo 4342 steps.
Prima di analizzare il risultato numerico, osserviamo l'albero ottenuto dai dati lasciando libero il programma di cercare la topologia più parsimoniosa. La topologia generale è coerente con quella della maggioranza delle filogenesi pubblicate finora. I risultati più inusuali sono la collocazione dei due ornithischi come sister-taxon di Neotheropoda rispetto ad herrerasauri e sauropodomorfi, e la collocazione di Allosaurus e Suchomimus dentro il gruppo dei compsognathidi e tyrannosauroidi (o, se volete descrivere la medesima cosa in modo diverso, con la collocazione di compsognathidi e tyrannosaurodi con i carnosauri). Entrambi questi risultati sono probabilmente l'effetto dello scarso campionamento nella parte basale di Dinosauria e dell'assenza della maggioranza dei tetanuri non-coelurosauri, che induce i due unici tetanuri basali inclusi (Allosaurus e Suchomimus) a collocarsi assieme ai soli coelurosauri vagamente simili a “carnosauri” (ovvero, i tyrannosauroidi).

L'analisi ottenuta senza imporre alcuna topologia, produce alberi lunghi 3780 steps. Sul piano quantitativo, l'albero di Peters è quindi 562 steps meno parsimonioso della topologia ottimale. Significa che la medesima matrice è spiegata dall'albero di Peters a patto di aggiungere 562 eventi evolutivi in più rispetto a quelli richiesti usando l'albero ottenuto dall'analisi filogenetica “libera”.

Cinquecento sessantadue steps in più sono tantissimi!

Anche senza fare il test di Templeton o altri test statistici per misurare la plausibilità di una topologia rispetto al mero caso, appare chiaro che l'albero di Peters è molto molto molto poco plausibile, poiché descrive i dati a disposizione con una enorme serie accessoria di eventi, ovvero, una quantità esageratamente alta di ipotesi non necessarie rispetto ad altre topologie che, pur ricavabili dal medesimo dataset, non richiedono così tanti eventi per giustificare i dati a disposizione. Un numero così alto di eventi supplementari non necessari è chiaramente molto improbabile, e risulta difficile da accettare come effetto di fattori casuali (errori di codifica, errori di campionamento, omoplasia, ecc...).
Difatti, il test di Templeton indica che l'albero di Peters ha una probabilità minore dello 0,01% di essere poco parsimonioso solamente per via del mero campionamento di dati.

Pertanto, l'improbabilità di quell'albero nel descrivere in modo parsimonioso i dati non è casuale. Il test dice che la matrice di Peters produce topologie di Theropoda prive di valore filogenetico.
Concludendo, quanto è probabile che l'albero di Peters sia il frutto del mero caso? Ovvero, se addestrassi un esercito di scimmie che codificano a caso delle matrici filogenetiche di quei taxa, quale è la probabilità che qualcuna di queste matrici fatte da scimmie ammaestrate produca, sempre per puro caso, una filogenesi indistinguibile da quella ottenuta da Peters? Più che una probabilità, è una certezza...

8 commenti:

  1. Con tutto il rispetto,leggendo l'albero di Peters(la prima immagine) mi è venuta pelle d'oca XD.Comunque bell'articolo!!

    RispondiElimina
  2. I already waited for this post, though I hoped it would be more nuclear. Peters has gone from someone on the fringe to a malicious person that flings around accusations.

    RispondiElimina
  3. io non ho titolo per commentare o giudicare, leggo con interesse, mi faccio le mie opinioni, ma le mie competenze sono così infime che non dovrei mettere becco in nulla, ma ... fermo restando che non so leggere i cladogrammi e tutto quello che ho già detto, ma nel primo schema tratto dal blog di peters mi sembra di vedere saurischi mischiati ad ornitischi. sbaglio?
    Emiliano

    RispondiElimina
  4. Well that's not really being fair, Andrea. You coded the taxa as they actually are, whereas Peters coded imaginary versions that result from him tracing over photos when he doesn't know theropod anatomy. Just looking at his newest post, he gives Dilong a postfrontal(!), has the anteroventral lacrimal as part of the maxilla, gives Sinocalliopteryx a fourth manual digit, doesn't realize that most of the reconstruction he thinks is Suchomimus is actually Baryonyx... it's just sad. I'm sure if either of us coded these theropods into Peters' matrix, the results would be more similar to the current consensus than his tree.

    RispondiElimina
    Risposte
    1. In fact, my test confirms that Peters' scores are indistinguishable from random.

      Elimina
    2. David Marjanović25/1/16 00:41

      :-D

      Elimina
  5. To be correct: a permutation test of that topology indicates that Peters' result is intermediate between parsimony and pure random trees. So, that topology is someway biased by some factors.

    RispondiElimina
  6. si sa perche i grandi arcosauri terrestri predatori (come gli uccelli del terrore e i coccodrilli terresti giganti come Barinasuchus) si sono estinti nel ceneozoico?
    e si sa qualcosa del metabolismo dei sebecidi?

    -valeria

    RispondiElimina

ATTENZIONE:
- COMMENTI OFFENSIVI, VOLGARI O SPAM SARANNO ELIMINATI. -
- I COMMENTI ANONIMI O PRIVI DI FIRMA SARANNO ELIMINATI. -