“Smanettando” con Eurogenes K13

Eurogenes K13 è probabilmente il calcolatore amatoriale presente su Gedmatch più indicato per gli individui di lignaggio europeo, anche se ha i suoi anni (sei, se non vado errato). Oggi, dal suo stesso autore, David Wesolowski (Davidski), abbiamo il Global25, che però è a pagamento. Reputo il K13 piuttosto affidabile e dunque ho creato, basandomi su di esso, grazie ad un programma specifico, alcune mappe che mettono in luce la realtà genetica italiana, anche inserita nel contesto europeo. Ricordo che me ne ero già occupato, e infatti vi rimando a questo articolo.

Pur trattandosi di prodotti amatoriali mostrano conclusioni affini a quelle degli studi accademici e, relativamente all’Italia, il noto cline genetico che va tanto in direzione nord-sud quanto in direzione est-ovest. La più nota dicotomia italiana è, infatti, quella che separa il Settentrione dal Mezzogiorno, ma ne esiste anche un’altra, che è quella che distanzia il Nord-Ovest dal Nord-Est e la costa tirrenica da quella adriatica. L’Italia segue, dunque, un gradiente genetico studiato da anni (vedi Barbujani, Sokal, Cavalli-Sforza e Piazza, tra i primi), che del resto è in linea con la naturale diversificazione territoriale ed etno-culturale di questo Paese.

Ho cercato di usare campioni da tutta Italia, escludendo aree non etnicamente italiane come quelle abitate da minoranze e, soprattutto, Val d’Aosta e Alto Adige; l’unica lacuna è rappresentata dall’Umbria, di cui ho un solo campione, perché gli Umbri sono letteralmente introvabili. A proposito, se qualche Umbro mi legge (anche della Sabina), prenda in considerazione l’idea di testarsi, perché è un peccato avere risultati abbastanza affidabili da ogni principale regione storica italiana, ad eccezione del cuore geografico umbro. Cosicché sono riuscito a coprire 26 aree etno-storiche, che divengono 60 se consideriamo le suddivisioni “provinciali”. Infatti ho analizzato l’Italia in chiave regionale, provinciale ed inserita nel contesto europeo.

Interessante è l’analisi dell’ambito regionale a partire dalle medie individuali, in cui mi sono avvalso di due centinaia di campioni dove le regioni principali possono contare su dieci soggetti ciascuna. Le aree rappresentate sono: per il Nord Insubria, Orobia, Piemonte, Liguria, Emilia occidentale, Emilia orientale, Romagna, Trentino, Veneto, Friuli; per il Centro Toscana, Corsica, Marche, Lazio; per il Sud Abruzzo, Sannio, Campania, Puglia, Lucania, Calabria citra; per il Sud estremo Salento, Calabria ultra, Sicilia orientale, Sicilia occidentale, Malta; infine la Sardegna.

Per quanto riguarda le componenti autosomiche prese in esame, quelle del K13, rimando a quest’altro articolo, in cui le passo in rassegna spiegando brevemente la loro natura, i picchi etnici e le aree geografiche in cui sono maggiormente diffuse. Qui vi presento i valori medi relativi alle varie regioni italiane prese in considerazione, inserite nei rispettivi gruppi macro-regionali (Nord-Ovest, Nord-Est, Centro, Sud, Sud estremo, Sardegna), evidenziati con colori diversi:

Medie regionali Eurogenes K13

Qui di seguito la griglia con gli indici di similarità e distanza euclidea dei vari campioni raccolti:

Similarità e distanze regionali Eurogenes K13

Ecco la PCA regionale:

PCA regionale Eurogenes K13

I cluster macro-regionali sono evidenziati in colore, mentre in rosso compaiono le relative medie; le diagonali in verde indicano, invece, la direzione delle componenti autosomiche (etno-geografiche, non sessuali) prese in esame. Nella mappa successiva è possibile apprezzare meglio le medie macro-regionali, nonché il sensibile stacco tra Centro-Nord Italia e Sud-Sud estremo, che esprime la frattura genetica attraversante il Paese all’altezza del confine tra Centro e Meridione (la Sardegna, come da copione, appare alla deriva per via del suo isolamento):

PCA medie macro-regionali Eurogenes K13

Ed ecco infine l’albero di connessione, che mostra la similarità tra i vari campioni presi in esame:

Albero di connessione regionale Eurogenes K13

Ora la PCoA (con il metodo Eigenvalue) delle medie individuali di campioni provenienti dalle 26 regioni etno-storiche d’Italia. In evidenza i cluster (che sono i gruppi) delle varie regioni e le medie regionali sottolineate dalle scritte in rosso. Mentre la Toscana appare spostata a mezzanotte, la Romagna funge da cinghia di trasmissione tra Nord e Centro-Sud, assieme all’Umbria, purtroppo assente. La Romagna, ovviamente, comprende anche l’area dell’Ager Gallicus, ossia il nord delle Marche. Il dato mediterraneo orientale (ENF, levantino antico, neolitico) è il principale responsabile del divario tra Settentrione e Meridione: mentre il Nord Italia segue l’andamento nord-atlantico (WHG, mesolitico, dei cacciatori-raccoglitori nativi d’Europa) dell’Europa occidentale, il Sud si allinea ai Balcani meridionali e, come risaputo, agli Ebrei europei quali Aschenaziti e Sefarditi. Bene precisare che, ciò nonostante, il Sud rimane distinto dal Levante, anche se taluni campioni estremi, soprattutto calabresi, presentano una forte tendenza in direzione di Cipro.

PCoA medie individuali K13

Qui la PCA delle medie individuali (con il metodo Eigenvalue), sempre evidenziate dalle scritte in rosso accanto ai quadratini pieni colorati. Le chiamo medie individuali, ma sono medie regionali formate dall’insieme degli individui campionati, una soluzione indubbiamente interessante:

PCA medie individuali Eurogenes K13

Ecco anche una PCA (con il metodo Eigenvalue) con le etichette individuali, anche se appare un po’ confusionaria, per ovvie ragioni:

PCA etichette individuali Eurogenes K13

Ed infine, l’albero di connessione della PCoA, con le sue svariate ramificazioni:

Albero di connessione individuale Eurogenes K13

Per il chiarimento dei termini tecnici snocciolati rinvio ai due articoli postati sopra. Veniamo all’ambito provinciale, relativo a territori italiani moderni che però corrispondono ad antiche entità etno-culturali (in numero di 60); ecco la PCoA (con il metodo Eigenvalue):

PCoA provinciale Eurogenes K13

L’assenza delle province romagnole, dell’Ager Gallicus e dell’Umbria crea un vuoto tra Nord e Centro-Sud, o meglio tra Nord-Toscana e Centro-Sud, che verrebbe colmato dalle suddette realtà intermedie. Qui abbiamo, invece, l’albero di connessione con le direttrici autosomiche in verde, le etichette provinciali e le consuete medie regionali, in rosso, formate dalle diverse province (Sardegna omessa, come sopra, perché avrebbe compresso troppo il cline):

Albero di connessione provinciale Eurogenes K13

Ed ecco l’analisi delle componenti principali, basata su Eurogenes K13, di diversi campioni genetici europei, rappresentanti altrettante popolazioni. Si può notare la collocazione dei cluster italici all’interno del panorama genetico europeo: mentre il Nord Italia segue la scia dell’Europa occidentale, il Sud si colloca nel cantone europeo sud-orientale, risultando più vicino a Greci ed Ebrei europei che al Centro-Nord. In rosso trovate le medie macro-regionali, in verde, anche qui, le diagonali che indicano la direzione delle componenti autosomiche prese in rassegna.

PCA europea Eurogenes K13

Il relativo albero di connessione è questo:

Albero di connessione europeo Eurogenes K13

Voglio chiudere il mio scritto con questa mappa (non mia, bensì di un utente polacco di qualche forum antro-genetico), tratta da Eurogenes V2 K15, similare al K13 (l’unica differenza sta nell’aggiunta di due ulteriori componenti autosomiche):

PCA europea Eurogenes V2 K15

Rispecchia l’ultimo studio accademico sul DNA degli Italiani (Raveane et al. 2018) che conferma la collocazione dei cluster italici all’interno del panorama genetico europeo, e che qui ribadiamo: il Nord Italia segue la scia dell’Europa occidentale, il Sud si colloca nel cantone europeo sud-orientale, risultando più vicino a Greci ed Ebrei europei che al Nord-Centro Italia, mentre l’Italia centrale scolora nel Nord e si distanzia parimenti dal Meridione. Da notare che il cluster iberico risulta non più a nord ma più a ovest di quello padano-alpino, e che il Meridione non forma un continuum con il Levante, da cui risulta separato da un certo divario. L’Italia dà vita ad un gradiente genetico unico in Europa, dove la frattura biologica esistente tra Centro-Nord e Sud viene in parte ricomposta andando ad analizzare la fascia mediana sud d’Italia (basso Lazio, Sabina, Piceno meridionale), che funge da cerniera tra Centro e Sud, così come Umbria e Romagna fungono da anello di congiunzione tra Centro e Nord. Non sorprendentemente, vista la posizione geografica occidentale, la Toscana risulta decisamente spostata a mezzanotte, rispetto alla fascia mediana pura.

Annunci

Informazioni su Paolo Sizzi

Lombardo, Italiano, Europeo per Sangue, Suolo, Spirito.
Questa voce è stata pubblicata in Genetica e contrassegnata con , , , , . Contrassegna il permalink.

29 risposte a “Smanettando” con Eurogenes K13

  1. Antiochus ha detto:

    Il global25 volendo si può scaricare gratuitamente se si ha voglia di maneggiarlo manualmente con R ad esempio ed nMonte, con il pregio di aver a disposizione una marea di campioni antichi anche recentissimi, inclusi i campioni medievali da Collegno(per un bel totale di 5178 campioni moderni e antichi, molto più di quanto il mio povero pc potrebbe gestire in formato grezzo). Ci stavo giocando proprio in questi giorni. La pecca effettivamente è che i campioni Italiani sono pochi e generici(i.e Abruzzo, Bergamo, “South”, Tuscan, WestSicilian, EastSicilian, Sardinian), penso presi dai soliti Hgdp e Dodecad/simili.
    Bergamo ad esempio si può modellare decentemente come ~63% Anatolia neolitica, ~8% WHG, ~20% Yamnaya Samara, ~5% CHG, ~3% ANE, che è molto vicino a ciò che in buona sostanza si trova accademicamente, probabilmente migliorabile utilizzando campioni più vicini temporalmente.

    Mi piace

    • Paolo Sizzi ha detto:

      Ci puoi giocare, è vero, ma con i risultati dei campioni accademici calcolati dal Polako, bene specificare. Per avere i propri bisogna pagare. I campioni sono tratti da HGDP, HapMap/1000 Genomes ecc.

      Mi piace

  2. Antonio Parisi ha detto:

    La ringrazio per l’articolo pubblicato che reputo assai interessante. Volevo chiederle: non sa se esista, per caso, da qualche parte, una tabella che leghi i gruppi geografici su scala mondiale che indica nella tabella agli aplogruppi/Haplogroup definiti, attualmente, in letteratura?

    Faccio un esempio … quando scrive Baltic immagino che faccia riferimento all’un tempo indicato “Ostbaltisch Gruppe” per indicare varie “subclade” dell’aplogruppo R1a, Quando scrive North Atlantic immaggino che faccia riferimento ai gruppi celtici spostatisi lungo le coste atlantiche che fanno riferimento a varie “subclade” dell’aplogruppo R1b … mi interesserebbe conoscere i legami tra gli altri gruppi geografici e gli aplogruppi con particolare riferimento ai seguenti aplogruppi:

    I1 (un tempo indicato come Nordisch)
    E3b
    J1
    J2

    Ricordo che sulle pagine di FTDNA (dove, anni or sono, ho fatto analizzare 67 sequenze del mio Y-DNA) esistono vari progetti, su scala mondiale, legati agli aplogruppi che sono di libero accesso.
    Grazie ed ancora complimenti per il suo coraggioso lavoro di empirizzazione e di smascheramento di “canoni teologici”.

    Mi piace

    • Paolo Sizzi ha detto:

      No veramente North Atlantic, Baltic, West Med. e così via sono etichette che indicano le componenti autosomiche, non sessuali, per così dire etno-geografiche. Possono correlarsi all’espansione degli aplogruppi, senza ombra di dubbio, ma sono due cose differenti.

      Mi piace

  3. Alberto Paolini ha detto:

    Mi piace moltissimo il suo sito.
    Pero’ non capisco qualcosa.
    Si’, la Lunigiana puo’ far parte del settore Emiliano ma la PROVINCIA DI LUCCA cosi’ vicino a Modena?

    Mi piace

    • Paolo Sizzi ha detto:

      Non deve sorprendere, la parte più settentrionale della Toscana è in continuità con l’area ligure ed emiliana occidentale, non esiste uno stacco. La Lunigiana, peraltro, non è nemmeno Toscana, tecnicamente; Lucca lo è ma rimane un’area interessata dall’antico sostrato ligure, influenzata dall’Italia nordoccidentale. La provincia lucchese include, inoltre, la Garfagnana, che segue la scia della Lunigiana.

      Mi piace

    • Alessandro ha detto:

      Perché Genova è più vicina a Firenze che a Reggio Emilia?

      Mi piace

      • Paolo Sizzi ha detto:

        Genova è più vicina a Reggio: 3.18 contro 3.45 (distanza Genova-Firenze). Certo, si parla di una differenza risibile.

        Mi piace

    • Alessandro ha detto:

      Se la provincia di Lucca è più vicina a Modena, Genova è più vicina a Firenze. Le Lagune cosa sono?

      Mi piace

      • Paolo Sizzi ha detto:

        Più o meno equidistante, ma Lucca non è Firenze, Lucca è più nordoccidentale (anche geneticamente). Le Lagune sono la zona lagunare veneta.

        Mi piace

    • M ha detto:

      Montanelli scrisse che i lucchesi sono “liguri toscanizzati” perché i lucchesi in Toscana sono considerati i più tirchi e chiusi, e per questo ricordano i liguri. Montanelli da “fiorentino” semplicemente prendeva in giro i lucchesi, perché i fiorentini si considerano i veri toscani e tutti gli altri toscani lo so meno. Per motivi linguistici talvolta anche gli aretini vengono presi in giro e definiti “umbri toscanizzati”, perché l’aretino ha una cadenza che ricorda l’umbro. Invece, ironia della sorte, il dialetto lucchese appartiene ai dialetti toscani occidentali insieme al pisano e al livornese e non ricorda per niente il ligure.

      Mi piace

  4. Alessandro ha detto:

    Interessante la posizione di Torino è più vicina al Veneto che alla Liguria. Perché?

    Mi piace

    • Paolo Sizzi ha detto:

      Perché Torino è a ridosso delle Alpi occidentali, che sono più nordiche della Pianura Padana, e così il Veneto, che ha più geni steppici del cuore padano (per steppici intendo recati da genti indoeuropee, provenienti da nord-est).

      Mi piace

      • Alessandro ha detto:

        Quindi le Alpi sono più nordorientali che nordoccidentali? Grazie molto interessante il suo sito

        Mi piace

      • Paolo Sizzi ha detto:

        Le Alpi hanno trattenuto maggiori geni nordici rispetto alla pianura, quindi sono più settentrionali se confrontate con la Val Padana. Tuttavia ci sono anche sacche neolitiche, sulle Alpi, come ad esempio nella zona bergamasco-bresciana, segno di eredità reto-etrusca. Chiaramente, di media, zone come Val d’Aosta e Piemonte rimangono ad ovest del Triveneto.

        Mi piace

  5. Alberto Paolini ha detto:

    La parlata lucchese fa parte del settore linguistico “Toscano occidentale” come il pisano e il livornese. Secondo Giacomo Devoto, il lucchese-pisano-livorno ha legami liguri.

    Pero’, secondo Giorgio Armanini nel suo libro “Ligures Apuani”, I dialetti di tipo Toscano si parlavano solamente nella pianura di Lucca e nella pianura di Massarosa.
    In tutta la Versilia,la Garfagnana e pure nella Mediavalle del Serchio si parlavano dialetti di tipo “apuano”. L’espansione medieval di Lucca e di Firenze (a Barga e Pietrasanta) ha cambiato la situazione linguistica.

    Apuano ha un lessico simile al emiliano e una fonologia simile al ligure.

    Mi piace

  6. Marco ha detto:

    Specificatamente hai idea di come si posizionino i laziali delle zone di Anzio e Latina?

    Mi piace

    • Paolo Sizzi ha detto:

      Tra Roma e Caserta, nel Basso Lazio (che è formato da gente di quelle zone, primariamente Ciociaria).

      Mi piace

      • Marco ha detto:

        Credi che i miei risultati siano tipici di lì? Se no, di dove lo sono? Eurogenes K13 Oracle results:
        K13 Oracle ref data revised 21 Nov 2013

        Kit PV6500266

        Admix Results (sorted):

        # Population Percent
        1 East_Med 25.22
        2 West_Med 24.59
        3 North_Atlantic 17.36
        4 West_Asian 16.26
        5 Baltic 10.88
        6 Red_Sea 3.7
        7 East_Asian 1.68
        8 Oceanian 0.31

        Single Population Sharing:

        # Population (source) Distance
        1 Central_Greek 4.97
        2 East_Sicilian 6.64
        3 Italian_Abruzzo 6.68
        4 Greek_Thessaly 7.58
        5 West_Sicilian 7.64
        6 South_Italian 7.82
        7 Tuscan 10.88
        8 Ashkenazi 11.6
        9 Algerian_Jewish 14.71
        10 Sephardic_Jewish 14.87
        11 Bulgarian 14.99
        12 Italian_Jewish 15.08
        13 North_Italian 15.71
        14 Romanian 17.02
        15 Tunisian_Jewish 18.86
        16 Libyan_Jewish 19.36
        17 Cyprian 19.71
        18 Turkish 20.97
        19 Serbian 21.24
        20 Lebanese_Muslim 23.09

        Mi piace

      • Paolo Sizzi ha detto:

        Di dove sei, scusa? Mi sembrano risultati da Abruzzo, più che da Italia mediana, anche se nel Basso Lazio il mondo mediano scolora in quello meridionale, come si sa.

        Mi piace

  7. Marco ha detto:

    Mia nonna materna è originaria della provincia di Ancona, delle zone vicino la provincia di Macerata e l’Umbria, mentre mio nonno materno è originario di San Costanzo, provincia di Pesaro e Urbino. Mio padre, per quanto ne so, proviene da Roma, più precisamente Ostia, ma non so se è realmente autoctono, dato che non l’ho mai conosciuto finora.
    Chiedo scusa per il ritardo della risposta…
    Ciò che più mi stupisce è l’altissimo retaggio CHG, che si affianca a un modesto retaggio ENF.
    Secondo un calcolatore derivo dai CHG nella stessa misura del campione cipriota di riferimento!

    Mi piace

    • Paolo Sizzi ha detto:

      “Colpa” dell’Adriatico, e di una probabile origine (parziale forse) meridionale del padre. Il Neolitico puro è più centro-settentrionale e sardo che centro-meridionale, però va anche distinto EEF da ENF, visto che il secondo è più spostato verso l’ambito orientale del bacino mediterraneo.

      Mi piace

      • Marco ha detto:

        Credi che la “colpa” dell’Adriatico possa essere imputabile perlopiù ai bizantini o a eventi preistorici/protostorici?

        Mi piace

      • Paolo Sizzi ha detto:

        Preistorici e protostorici, senza dubbio. Non credo che i Bizantini abbiano lasciato tracce genetiche autosomiche concrete, al punto di alterare il pool genico italiano. L’Italia, geneticamente, è cristallizzata alla situazione preromana.

        Mi piace

  8. Marco ha detto:

    Credi che il loro impatto sia stato veramente così marginale? Grazie per le informazioni che mi hai dato. I sardi sono gli europei geneticamente più vicini ai contadini neolitici europei, noti come EEF, un misto fra ENF e WHG. Ciò che rende i meridionali relativamente vicini agli arabi levantini è l’alto retaggio ENF e CHG, ma se il retaggio ENF è principalmente neolitico, allora i primi contadini neolitici, che provenivano dal vicino oriente, erano più o meno simili agli odierni ciprioti, ma con molto meno CHG, giusto? Mescolandosi con i WHG, cosa avvenuta molto più spesso fra quelli che hanno seguito rotte via terra piuttosto che marittime, sono diventati EEF, giusto? Il CHG quando è arrivato e attraverso quali percorsi?

    Mi piace

    • Paolo Sizzi ha detto:

      L’EEF è neolitico mescolato a geni mesolitici di indigeni preistorici europei; ENF è neolitico levantino antico vicino ai Natufiani; CHG proviene dal Caucaso ed è giunto in Europa probabilmente durante l’Età del rame (in Italia via mare e Balcani), ma anche grazie alle invasioni indoeuropee, come dimostrano i campioni di Yamnaya. L’eccesso di CHG nell’Italia centro-meridionale è imputabile al retaggio levantino antico, che in Grecia è stato diluito dalle varie invasioni indoeuropee che al Sud non ci sono state (o hanno avuto un impatto scarso).

      Mi piace

      • Marco ha detto:

        Visto che sembri uno dei pochissimi individui dotti realmente sull’argomento vorrei rivolgerti un’ulteriore domanda: possono esistere, per esempio, napoletani geneticamente più vicini a dei salernitari che a degli altri napoletani? Se c’è ragione di credere che gli individui di una data zona sono gli epigoni di soggetti che sono stati analogamente interessati dai vari fattori che cambiano le frequenze alleliche, allora gli individui di quella zona condividono fra loro la probabilità matematica di ereditare specifici alleli, e dato che l’evoluzione biologica consiste principalmente in cambiamenti nelle frequenze alleliche, risulta più probabile, magari anche di poco, che abbiano lo stesso allele due napoletani autoctoni o due salernitani autoctoni presi a caso piuttosto che un salernitano e un napoletano presi a caso. Sui vari calcolatori amatoriali sembrano indistinguibili: questo perché viene usata una quantità relativamente limitata di polimorfismi a singolo nucleotide; ma se ne venissero usati molti più polimorfismi sarebbe addirittura possibile distinguere gli autoctoni di diversi comuni della stessa provincia? Io noto differenze nei tratte delle persone già da un paesino all’altra, e ciò riflette lo schema intellegibile poc’anzi esposto, che è valido per ogni allele essenzialmente, quindi direi di sì…

        Mi piace

      • Paolo Sizzi ha detto:

        Più l’indagine genetica si fa approfondita e più è plausibile distinguere una comunità dall’altra; come è possibile distinguere più individui di Reggio Emilia da più individui di Parma, così è possibile distinguere individui di Fidenza da individui di Salsomaggiore (che sono due comuni in provincia di Parma). Se non esistono barriere geografiche o linguistiche, che fanno anche da barriere genetiche, è però probabile che dei tizi di una provincia siano più vicini a dei tizi di un’altra provincia, rispetto ad altri della propria, ma questo perché spesso e volentieri i confini delle comunità sono tirati giù col righello, e non rispettano vincoli identitari, storici e linguistici. Si prenda il caso della Lunigiana, parte in provincia di La Spezia e parte in provincia di Massa e Carrara: i Lunensi sono più vicini, mediamente, agli Emiliani occidentali, che ai Liguri o ai Toscani, e questo logicamente contraddice le suddivisioni provinciali e regionali. Bisogna ragionare in termini di sangue, supportati appunto dalla genetica, se si vuole ricavare un quadro identitario coerente con la biologia, senza comunque scivolare nei facili campanilismi: Napoletani e Salernitani sono diversi ma comunque parte del medesimo ambito campano e ausonico.

        Mi piace

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Google photo

Stai commentando usando il tuo account Google. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...