Alcune settimane fa, Dave
Peters mi contattò per chiedermi una copia in formato nexus
della matrice che assemblai per l'articolo sulle affinità di Balaur.
Sebbene in passato Peters non sia stato
particolarmente tenero con me, e ciò per il fatto che qui e sul suo blog smentii in toto la sua personale
(e pienamente infondata) ricostruzione di Aurornis (la mia
smentita era basata sulla osservazione diretta dell'olotipo di
Aurornis allora conservato a Bruxelles), non avevo motivi per
negare una richiesta di dati pubblicati. La scienza è ripetibilità
dei risultati e democrazia dell'accesso ai dati. Pur temendo un uso,
diciamo, “idiosincratico” della matrice, gli inviai il file.
Recentemente, ho scoperto il motivo di
tale richiesta: sul suo blog, Peters ha “confrontato” la
topologia di Theropoda risultata dalla mia matrice con quella che
egli ha ricavato all'interno dalla sua discutibile
filogenesi dei rettili. Non mi soffermo a discutere le bizzarre
argomentazioni con le quali pare “confrontare” le due filogenesi.
Peters è così convinto che la sua piccola matrice sbilanciata nel
rapporto taxa-caratteri (circa 3:1, quando sarebbe buona norma avere
un rapporto inverso), associata alla sua soggettiva metodologia di
ricostruzione scheletrica, produca dei risultati “sensati” sul
piano filogenetico (nonostante sia del tutto smentita da migliaia di
studi di zoologia e paleontologia) che è inutile perdere tempo in
quel discorso. Allo stesso modo, è inutile rimarcare che Peters usi
degli artifici matematici ingiustificati per argomentare che la
topologia di Theropoda, risultata dalla matrice che gli ho inviato,
sia debole e discutibile. Analogamente, se Peters ritiene che la
risoluzione di un cladogramma sia un fine a prescindere dai dati, è
inutile fargli notare che qualsiasi matrice costruita con un ridotto
rapporto caratteri/taxa (pochi caratteri vs tanti taxa) – per
giunta codificata in modo soggettivo come la sua – produce
facilmente ciò che si desidere ottenere a priori.
In questo post, molto semplicemente,
ritorcerò l'approccio di Peters (usato contro la mia analisi)
contro l'analisi stessa di Peters, per mostrare come la sua
“filogenesi” di Theropoda sia del tutto infondata.
Innanzitutto, questa è la topologia
che risulta a Peters per i dinosauri inclusi nella sua analisi (immagine tratta dal suo blog).
Notate come la topologia sia del tutto
in disaccordo con quanto risulta alla grande maggioranza dei
paleontologi. Ciò, di per sé, non sarebbe un problema. La scienza
non è dogmatica, e non pretende di avere una visione unica di un
problema. Tuttavia, se la grandissima maggioranza dei paleontologi
che studiano i dinosauri concorda su una topologia generale, e se
tale topologia generale è basata su un secolo di dati raccolti e
pubblicati, accessibili e ripetibili, è giustificato mettere un
grosso dubbio sulla idiosincratica filogenesi sostenuta solo da
Peters. Anche se ci sono divergenze tra gli studiosi sui dettagli,
nessun paleontologo ha mai pubblicato una filogenesi così “inusuale”
come quella di Peters, quindi è saggio prendere tale ipotesi
alternativa con un buon tasso di scetticismo, perlomeno fintanto che
sarà basata su un metodo soggettivo e non testabile come quello di
Peters.
Come esempio sufficiente a mostrarvi
quanto sia improbabile la filogenesi di Peters, faccio notare che, in
quel cladogramma, Tyrannosaurus risulta all'interno di un
clade composto da microraptorini. Anche se non siete esperti in
morfologia dei coelurosauri, anche se non avete mai codificato una
matrice filogenetica in vita vostra, mi auguro che riterrete
altamente improbabile che Tyrannosaurus discenda da un animale
di grado microraptorino, sopratutto quando altri taxa riconosciuti
come tyrannosauroidi (come Dilong, Guanlong e
Yutyrannus) sono anche essi presenti nella medesima filogenesi
ma risultano collocati altrove nell'albero, lontano dai
microraptorini.
E se questo dettaglio non vi pare
sufficiente per criticare la filogenesi di Peters, e volete un
qualche test matematico per misurare la probabilità che l'analisi di
Peters produca una accurata descrizione delle relazioni filogenetiche
di Theropoda, eccovi accontentati.
Sulla stregua della “analisi” con
cui Peters ha sollevato dubbi nei confronti della mia filogenesi, ho
usato Megamatrice per testare la filogenesi di Peters. Ho incluso
solamente i medesimi taxa usati da Peters nella sua analisi e che
fossero anche presenti in Megamatrice (unica eccezione, ho usato
Ornithomimus al posto di Struthiomimus, dato che questo
ultimo non è ancora incluso in Megamatrice: tale differenza di taxa
non dovrebbe incidere significativamente, data la generale
somiglianza tra questi due ornithomimidi: in ogni caso, la matrice di
Peters non include altri ornithomimidi, quindi è ragionevole che non
campioni tra i caratteri che distinguono Ornithomimus da
Struthiomimus).
Ho imposto all'analisi di produrre la
medesima topologia ottenuta da Peters, e l'ho confrontata con quella
che si ottiene analizzando i dati senza imporre a priori
alcuna topologia, per stabilire se e quanto l'albero prodotto da
Peters abbia un significato filogenetico deducibile dai caratteri
analizzati in Megamatrice.
La sottomatrice analizzata comprende 59
taxa. Il numero dei caratteri di Megamatrice risultati informativi
per quel campione di taxa è 1073, circa nove volte quelli utilizzati
da Peters. Sebbene Peters sostenga che un aumento importante dei
caratteri non sia rilevante per una filogenesi (e ciò al fine di
giustificare la sua matrice nella quale i caratteri sono molto pochi
rispetto ai taxa), io resto della vecchia idea che l'aumento di
informazione è preferibile ad una riduzione di dati, dato che al
diminuire dei dati aumenta l'incidenza dell'errore di campionamento.
Se ho più di mille caratteri che mostrano una variabilità nel
campione, una variabilità che ritengo sia un segnale filogenetico,
non ho motivo per ridurre arbitrariamente quell'insieme di caratteri.
Anzi, tale riduzione di informazione avvicina maggiormente il mio
risultato alla pericolosa soglia della mera casualità (il produrre
alberi puramente arbitrari prodotti da un piccolo pacchetto di dati
scelti più o meno a caso).
Ecco cosa ho ottenuto.
Imponendo la topologia risultata a
Peters, si ricava un albero lungo 4342 steps.
Prima di analizzare il risultato
numerico, osserviamo l'albero ottenuto dai dati lasciando libero il
programma di cercare la topologia più parsimoniosa. La topologia
generale è coerente con quella della maggioranza delle filogenesi
pubblicate finora. I risultati più inusuali sono la collocazione dei
due ornithischi come sister-taxon di Neotheropoda rispetto ad
herrerasauri e sauropodomorfi, e la collocazione di Allosaurus e
Suchomimus dentro il gruppo dei compsognathidi e tyrannosauroidi (o,
se volete descrivere la medesima cosa in modo diverso, con la
collocazione di compsognathidi e tyrannosaurodi con i carnosauri).
Entrambi questi risultati sono probabilmente l'effetto dello scarso
campionamento nella parte basale di Dinosauria e dell'assenza della
maggioranza dei tetanuri non-coelurosauri, che induce i due unici
tetanuri basali inclusi (Allosaurus e Suchomimus) a
collocarsi assieme ai soli coelurosauri vagamente simili a
“carnosauri” (ovvero, i tyrannosauroidi).
L'analisi ottenuta senza imporre alcuna
topologia, produce alberi lunghi 3780 steps. Sul piano quantitativo,
l'albero di Peters è quindi 562 steps meno parsimonioso della
topologia ottimale. Significa che la medesima matrice è spiegata
dall'albero di Peters a patto di aggiungere 562 eventi evolutivi in
più rispetto a quelli richiesti usando l'albero ottenuto
dall'analisi filogenetica “libera”.
Cinquecento
sessantadue steps in più sono tantissimi!
Anche
senza fare il test di Templeton o altri test statistici per misurare
la plausibilità di una topologia rispetto al mero caso, appare
chiaro che l'albero di Peters è molto molto molto poco plausibile,
poiché descrive i dati a disposizione con una enorme serie
accessoria di eventi, ovvero, una quantità esageratamente alta di
ipotesi non necessarie rispetto ad altre topologie che, pur
ricavabili dal medesimo dataset, non richiedono così tanti eventi
per giustificare i dati a disposizione. Un numero così alto di
eventi supplementari non necessari è chiaramente molto improbabile,
e risulta difficile da accettare come effetto di fattori casuali
(errori di codifica, errori di campionamento, omoplasia, ecc...).
Difatti,
il test di Templeton indica che l'albero di Peters ha una probabilità
minore dello 0,01% di essere poco parsimonioso solamente per via del
mero campionamento di dati.
Pertanto,
l'improbabilità di quell'albero nel descrivere in modo parsimonioso
i dati non è casuale. Il test dice che la matrice di Peters
produce topologie di Theropoda prive di valore filogenetico.
Concludendo,
quanto è probabile che l'albero di Peters sia il frutto del mero
caso? Ovvero, se addestrassi un esercito di scimmie che codificano a
caso delle matrici filogenetiche di quei taxa, quale è la
probabilità che qualcuna di queste matrici fatte da scimmie
ammaestrate produca, sempre per puro caso, una filogenesi
indistinguibile da quella ottenuta da Peters? Più che una
probabilità, è una certezza...