06 giugno 2013

Alcuni dettagli metodologici sull'analisi filogenetica su Aurornis

Ad una settimana dalla pubblicazione dello studio che istituisce Aurornis, penso sia doveroso scrivere un post che parli dell'analisi filogenetica inclusa in quello studio, che è stato il mio contributo maggiore alla ricerca, oltre a collaborare alla descrizione dell'esemplare.
Come alcuni di voi sapranno, io sto assemblando una ampia analisi filogenetica di Theropoda, chiamata informalmente "Megamatrice". Lo scopo di Megamatrice è quello di fornire un data set il più ampio, dettagliato ed aggiornato possibile sulla distribuzione e presenza di caratteri morfologici (prettamente osteologici, ma anche tegumentari e relativi alla riproduzione - come uova e forma dei nidi) nei theropodi mesozoici. Questo data set è strutturato inoltre per essere analizzato con programmi di analisi filogenetica, per generare ipotesi sulle relazioni filetiche tra i taxa inclusi. 
I caratteri in Megamatrice sono tratti principalmente dalla ampia letteratura sui theropodi mesozoici e sui dinosauromorfi basali: questi ultimi sono inclusi al fine di determinare anche la topologia dell'intorno immediato della base di Theropoda. Molti caratteri esistenti in letteratura sono stati modificati nella loro definizione, specialmente nei casi in cui uno stesso carattere poteva essere scomposto in caratteri distinti ed indipendenti, oppure quando lo "stesso carattere" era presente in forme differenti e necessitava di una "fusione" (questo ultimo caso è più diffuso per i caratteri significativi in Avialae, dove sovente la terminologia è differente dagli omologhi caratteri nel resto della filogenesi: è stato necessario uniformare la terminologia).
Ad eccezione di un taxon vivente, attualmente Megamatrice non comprende aviani cenozoici, sebbene la loro progressiva inclusione sia tra i propositi futuri. 
Siccome lo scopo dell'indagine su Aurornis non era di produrre l'intera topologia di Theropoda, ma di valutare sopratutto i differenti scenari proposti alla base di Paraves, ho rimosso dall'analisi quei taxa non "necessari". Sebbene lo scopo dell'indagine fosse Paraves, ho comunque mantenuto una serie di taxa non-paraviani a rappresentanza dei principali cladi di Coelurosauria, e quattro non-coelurosauri in modo da avere una discreata radice alla base dell'albero, sufficientemente "lontana" da Paraves da non influenzare a priori la topologia dell'oggetto principale dell'analisi. 
Mentre i taxa sono stati scelti "attivamente", i caratteri scelti sono stati un "effetto" della scelta dei taxa: una volta omessi i taxa "scartati", il numero dei caratteri filogeneticamente significativi è sceso dai 1500 iniziali a 992. Questa procedura ha, a mio avviso, un vantaggio rispetto al metodo "classico" di scegliere i caratteri in modo "attivo": i caratteri non vengono imposti a priori, ma risultano "conservati" scremando quelli che non presentano una variabilità nell'abito dei taxa conservati dopo la "scrematura". In questo modo, anche caratteri che tradizionalmente non sono considerati "significativi" per le relazioni tra i paraviani sono stati inclusi, aumentando la risoluzione dell'analisi e riducendo il rischio che le relazioni fossero "indotte" a priori dalla scelta dei caratteri che "ci fanno comodo".
Oltre all'analisi "base", nella quale si è determinato l'insieme delle topologie descriventi nel modo più parsimonioso la distribuzione delle condizioni nei 992 caratteri significativi (ed il cui consenso stretto è mostrato qui sotto), abbiamo anche svolto delle analisi in cui determinate relazioni - assenti nel risultato ma discusse da precedenti studi sui paraviani - erano imposte a priori. 

Lo scopo di questi test era di determinare la differenza (in numero di steps) tra il risultato più parsimonioso emerso e quelle topologie alternative. I test si sono focalizzati su ipotesi nelle quali parte dei taxa risultati prossimi o alla base di Avialae (in particolare, i troodontidi, gli "archaeopterygidi", Balaur e Rahonavis) sono stati imposti come membri di Deinonychosauria. Dai test risulta che occorrono almeno 4 steps supplementari per posizionare Troodontidae in Deinonychosauria, e da 8 a 17 steps supplementari per collocare uno o più degli aviali basali "controversi" in Deinonychosauria (i dettagli di questi test sono nelle informazioni supplementari al nostro articolo - Godefroit et al. 2013 - quindi ometto di riproporli qui).

Bibliografia:

6 commenti:

  1. Scusa, da assoluto profano e ignorante, ma 4 steps non sono "pochissimi", e 8-17 non sono comunque relativamente pochi, anche se più abbondanti?

    Insomma qual'è il "peso" di uno steps?

    Valerio

    RispondiElimina
    Risposte
    1. Uno step non ha 'un peso'. Esso è solo un termine per definire un evento di trasformazione dalla condizione X alla condizione Y in un carattere dell'analisi.
      Un concetto che molti fraintendono è pensare che gli steps siano una proprietà dell'evoluzione, mentre essi sono solo una misura della differenza tra differenti alberi dedotti dalla stessa matrice. Il numero di steps non è quindi un valore assoluto, né una proprietà intrinseca dei processi evolutivi, ed avulso dall'analisi particolare in cui è calcolato non ha alcun significato.
      Non esiste un criterio per stabilire oltre quale quantità di steps si assume una topologia "robusta". Esistono metodi statistici per dire che una differenza di X steps tra l'albero A e l'albero B (alberi dalla stessa matrice, non alberi da 2 diverse matrici) sono significativamente differenti o meno (e nel primo caso, "vince" quello con meno steps). Tuttavia, tale significatività ha senso solo assumendo che stiamo campionando a caso per generare i due alberi, criterio che molti considerano non realistico nel caso di alberi filogenetici che descrivono la distribuzione dei caratteri nei taxa.

      Elimina
  2. Ciao Andea,

    prima di tutto, auguroni per il tuo articolo! Davvero una gran bella cosa :)

    Una domanda per il tuo commento qua sopra: il test di cui stai parlando è il templeton test? Quindi, se ho capito bene, non lo ritieni utile per capire se la matrice ha abbastanza forza espressiva per escludere con significatività che un taxon appartiene a un clade preimpostato? Sono curioso perchè stavo pensando di usarlo per la mia analisi di diplodocidi.

    A presto
    Emanuel

    RispondiElimina
    Risposte
    1. Grazie, Emanuel.
      Sì, mi riferivo al test di Templeton.
      Il test ci dice semplicemente se le differenze in steps tra le topologie sono indistinguibili o meno da un campionamento causale, ma ciò è un test sulla significatività della campionatura della matrice, non sulla validità o meno di uno scenario evoluzionistico rispetto ad un altro. Inoltre, alcuni autori hanno sottolineato come il test sia valido solo se si ottengono topologie perfettamente dicotomiche, cosa che in molti casi non avviene, se non omettendo a priori alcuni taxa (cosa che, però, "falsa" il risultato: ed è il motivo per cui non ho eseguito il test sulla matrice su Aurornis: se si omettono dei taxa il cladogramma risultante non è lo stesso dell'analisi originale, quindi non è chiaro a questo punto il "senso" del test se analizza un diverso set di dati ottenuto "riducendo" l'originale).
      Un esempio interessante del metodo è discusso da Ketchum e Benson (2010) per i plesiosauri.

      Elimina
  3. Un commento parla di "peso". Ho letto in alcune pubblicazioni che un particolare stato di carattere può avere un peso diverso da un altro stato dello stesso carattere.
    Cosa si intende con peso? Uno stato di carattere con un peso maggiore di un altro identifica un numero maggiore di passi evolutivi. In altre parola, uno stato di carattere con peso 3 identifica 3 passi evolutivi? Il ricercatore in questo caso deve stabilire a priori che per arrivare dal punto a al punto z sono stati necessari x passi evolutivi? Megamatrice usa il "peso"?
    Ciao e grazie

    RispondiElimina
    Risposte
    1. Si può impostare l'analisi definendo che alcuni caratteri siano più "importanti" di altri, ovvero che abbiano un maggiore "peso" nel determinare i nodi. Il "peso" può essere imposto a priori, prima di iniziare l'analisi, oppure può essere calcolato via via che l'analisi procede. Il primo caso è difficile da stabilire (come si fa a sapere che un carattere è "più importante"? Ed anche se lo si stabilisce, quanto "vale" tale peso?), nel secondo esistono procedure automatiche che possono essere impostate, per cui i caratteri più omoplastici (ovvero, quelli con un maggior grado di convergenza e reversione) avranno peso più basso.
      Megamatrice posso analizzarla sia senza "peso" che "con peso".

      Elimina

ATTENZIONE:
- COMMENTI OFFENSIVI, VOLGARI O SPAM SARANNO ELIMINATI. -
- I COMMENTI ANONIMI O PRIVI DI FIRMA SARANNO ELIMINATI. -