Inligting

Is daar enige rede waarom 'n arbitrêre DNA-volgorde soos 5'-ACACACACAC-3' nie in die natuur sal bestaan ​​nie?

Is daar enige rede waarom 'n arbitrêre DNA-volgorde soos 5'-ACACACACAC-3' nie in die natuur sal bestaan ​​nie?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ek maak 'n DNS-model vir my klas, en ek het 'n paar voorbeelde opgesoek en hulle het almal verskillende volgordes van basisse. As ek 'n arbitrêre volgorde kies soos:

5'-ACACACACAC-3' 3'-TGTGTGTGTG-5'

of

5'-ATATATATAT-3' 3'-TATATATATAT-5'

Is daar enige rede dat dit nie in die natuur sou bestaan ​​nie?


DNS het 'n polariteit wat gebaseer is op die nommering van die koolstofatome in die deoksiribose molekules in die suikerfosfaat ruggrate van die twee komplementêre stringe.

So, byvoorbeeld, is die 3'-OH van een basis se suiker geheg, via 'n fosfaat, aan die 5'-OH van die suiker op die aangrensende basis in die string.

Daarom sê ons dat die een kant van 'n enkelstrengige stuk DNS 'n 5'-end het, en aan die ander kant 'n 3'-end.

Gaan nie verder totdat jy hierdie konsep verstaan ​​en 'n prentjie hiervan kan teken nie.

In Watson en Crick se model vir dubbelstring-DNS is die twee komplementêre stringe anti-parallel. Met ander woorde, as jy die dubbelheliks soos 'n leer voorstel, dan is een van die bene van die leer in die 5' --> 3' rigting georiënteer, terwyl die ander, komplementêre string in die 3' --> gerig is. 5' rigting.

Wanneer ons 'n DNS-volgorde beskryf, lees ons volgens konvensie die volgordestringe in die 5'--> 3'-rigting.

So nou behoort jy jou navraag meer bondig te kan stel.


Jy moet eers 'n paar dinge verstaan:

  1. Waarvan word proteïene gemaak
  2. Waarvan is DNA gemaak
  3. Wat is die verwantskap tussen DNA en proteïene

Van DNA tot proteïene

DNA is getranskribeer in RNA wat dan is vertaal in proteïen. Die proteïen het dan 'n effek (bv. kan 'n ensiematiese effek wees) soos om die vlak van suiker in die sel te beïnvloed, sommige lipiede te verteer of die uitdrukking van ander gene te beïnvloed.

Meer inligting oor Khan Academy > Central Dogma

Waarvan is DNA gemaak?

DNA (of ten minste die genetiese kode) word gemaak van 4 verskillende molekules wat nukleotiede genoem word. Ons verkort hul name met die letters A,T,C en G.

Waarvan word proteïene gemaak?

Proteïene word gemaak van aminosure. Daar is ~20 verskillende aminosure.

Genetiese kode

Vir die belang van jou vraag is dit nou noodsaaklik om te verstaan ​​hoe die opeenvolging van nukleotiede A,T,C,G in die DNA in die proteïen weerspieël word. Dit word die genetiese kode.

Ons noem 'n reeks van drie nukleotiede 'n kodon.AATis byvoorbeeld 'n kodon. Elke kodon (behalwe spesiale kodons) stem ooreen met 'n spesifieke aminosuur. Hierdie ooreenkoms word die genetiese kode genoem. Hier is die universele genetiese kode (waar dieTis vervang deurUomdat RNA bevatUin plaas vanT)

Beskou byvoorbeeld die kodonVAEenAUU(waar slegs die volgorde verander) Die eerste een kodeer vir die aminosuurTyrterwyl die ander kodes virIle. So ja, die volgorde maak saak.

Inligtingsteorie

Globaal gesproke, vir enige inligting is die volgorde van 'n ry van fundamentele belang! Meer inligting oor Khan Academy > Inligtingsteorie.


Basisvolgorde op 'n string sal NIE saak maak voordat jy van 'n spesifieke geen of motief vertel nie.

Wanneer jy egter 2 drade maak, moet jy die BASIS-PAARREËL STRENG handhaaf.

p.s. Maak seker die 2 stringe sal nooit aan mekaar raak nie; hulle sal dieselfde parallelle afstand deur hul lengtes handhaaf; en beide helix sal dieselfde rigting van kronkel hê (regterhandskroeftipe, vir Watson-Crick-model en B-DNA).


Ja hulle maak saak. Stel jou voor dat jy net een kant van die DNA-string lees. Dit is hoe die kode eintlik gelees word, so die volgorde sal daardie kant se lesing verander.

ACAAGATGCCATTG

is anders as

ACAAGATGCCATTC

Let op die verskillende laaste basis wat die boodskap anders maak. Dit kan transkodering na proteïene beïnvloed.

Net soos die verandering van een letter die betekenis van die Engelse woord "petty" kan verander na "patty". Dieselfde geld vir enige geënkodeerde boodskap.


Moet ons menslike gene patenteer?

Moet menslike DNA patenteerbaar wees? Dit is die sentrale vraag in Vereniging vir Molekulêre Patologie v. Myriad Genetics, 'n saak wat in April voor die Amerikaanse hooggeregshof aangevoer is. Die regsgeding is deur die American Civil Liberties Union georganiseer namens verskeie professionele organisasies wat al lank sulke patente gekant het, wat die Amerikaanse Patent- en Handelsmerkkantoor sedert die 1980's toestaan.

Patentereg is geheimsinnig, en argumente daaroor kan baie klink soos stryery oor die aantal engele wat op die kop van 'n speld kan dans. Maar in hierdie geval raak dit tientalle miljarde dollars aan navorsing, produkte en winste.

Ter sprake is verskeie patente wat verband hou met twee borskankergene, BRCA 1 en BRCA 2. In die 1990's het navorsers by Myriad Genetics twee gene geïdentifiseer en geïsoleer waarin sekere mutasies die risiko van bors- en eierstokkanker dramaties verhoog. Die maatskappy het toe ’n produk aangebied, genaamd BRACAnalysis, wat pasiënte se BRCA-genetiese volgordes vergelyk met die maatskappy se verwysingsvolgorde om die mutasies te identifiseer. Gewapen met die wete dat hulle 'n groter risiko het, kan pasiënte dan betrokke raak by beskermende aksies wat wissel van meer gereelde mammogramme en ultraklankondersoeke tot dat hul borste en eierstokke chirurgies verwyder word.

Die Hooggeregshof moet besluit of Myriad bloot produkte gebruik wat in die natuur bestaan ​​(wat nie gepatenteer kan word nie) of as dit 'n "nuwe en nuttige proses, masjien, vervaardiging of samestelling van materie, of enige nuwe en nuttige verbetering daarvan" uitgevind het. (wat kan).

Hoekom wil die eisers menslike geen patente ongeldig maak? As 'n kwessie van beleid, hoofsaaklik omdat hulle glo dat sulke patente waardevolle navorsing en ontwikkeling belemmer eerder as bespoedig. Die Vereniging vir Molekulêre Patologie noem byvoorbeeld ramings dat "ongeveer 20 persent van die menslike genoom onder patent is" en voer aan dat "wetenskaplike navorsing vertraag, beperk of selfs gesluit is weens kommer oor geenpatente."

As 'n kwessie van reg, die eisers voer aan dat 'n geen wat deur Myriad geïsoleer is, dieselfde genetiese inligting oordra as 'n geen wat in 'n menslike liggaam gevind word en dat dit dus "dieselfde natuurwette as genomiese DNA verteenwoordig." Myriad, kom die ACLU tot die gevolgtrekking, "in werklikheid voer aan dat dit 'n patent op 'n produk of natuurwet self kan verkry as dit 'n nuwe gebruik daarvoor vind."

In sy opdrag sê Myriad dat niemand 'n patent sal betwis op 'n nuwe chemikalie wat op 'n bloed- of weefselmonster toegepas kan word om 'n hoër kankerrisiko op te spoor nie. "Dit is wat Myriad se gepatenteerde molekules is," beweer die maatskappy, "en hulle was nooit vir die wêreld beskikbaar nie totdat Myriad se wetenskaplikes hul fakulteite toegepas het op 'n voorheen ongekende massa genetiese materiaal om die geïsoleerde DNA-molekules te identifiseer, definieer en skep ."

Wie is reg? Dit is verhelderend om te oorweeg hoe die patentkantoor die produk-van-natuur-leerstelling toepas. In een opleidingsvoorbeeld merk die kantoor op dat dit bekend is dat blootstelling aan sonlig sommige mense se buie beïnvloed. As iemand probeer om 'n metode te patenteer vir die behandeling van seisoenale affektiewe versteuring wat behels dat 'n pasiënt aan sonlig blootgestel word, sal die aansoek afgekeur word, aangesien dit "niks meer as die wet van die natuur is nie, plus om mense te vertel om dit toe te pas." Die kantoor sal ook nie 'n nouer patent uitreik om die pasiënt aan 'n bron van wit lig bloot te stel nie, aangesien die son ook 'n bron van wit lig is. Maar dit sou patenteer 'n behandeling waarin 'n pasiënt presies geposisioneer is vir 'n bepaalde tydsduur naby 'n wit ligbron waaruit ultravioletstrale gefiltreer is. Trouens, net so 'n behandeling is in 2002 gepatenteer.

Is Myriad se molekules dus meer soos om 'n pasiënt aan te raai om in die somersonlig te sit of meer soos om 'n kontrepsie te skep wat hom in die dieptes van die winter aan wit lig blootstel? Ek is nie ’n patentprokureur nie, maar dit lyk vir my asof geenpatente meer soos laasgenoemde is – dat die geïsoleerde DNS-molekules die resultaat van menslike vernuf is en saamgestel, vervaardig en verbeter word, nie bloot ontdek of gevind word nie.

Die openbare beleidskwessie laat 'n ander vraag ontstaan: Bevorder geenpatente vooruitgang, of belemmer dit ontdekking en uitvinding? In sy opdrag maak Myriad die onbetwiste punt dat sedert sy BRCA-patente uitgereik is, 18 000 navorsers studies gedoen het wat daardie gene betrek, meer as 8 000 wetenskaplike artikels gepubliseer het en meer as 130 kliniese proewe gedoen het. Dit is baie vordering, en die bewyse dat die patente verhoed het dat nog meer vordering plaasvind, is skraal. Christopher Holman, 'n professor aan die Universiteit van Missouri-Kansas City Law School, het in 'n onlangse, omvattende ontleding die bewering dat 20 persent van menslike gene gepatenteer is en dat dit 'n padblokkade na nuwer genetiese tegnologieë vorm, soos toetse gebaseer op heelgenoomvolgordebepaling.

Die bewering dat 20 persent van menslike gene gepatenteer is, kom uit 'n 2005-artikel in Wetenskap tydskrif. Die Wetenskap skrywers het aanvaar dat die vermelding van 'n geen se DNS-volgorde in 'n patenteis gelykstaande is aan patentering van die geen, maar in die meeste gevalle is dit nie so nie. Wat meer is, die opeenvolging van 'n hele genoom vereis nie die gebruik van geïsoleerde gene nie. Dit behels dat 'n persoon se DNS deur 'n opsporingstoestel bestuur word om die spesifieke volgorde van DNS-basispare te bepaal. In baie min gevalle sal voorafbestaande patente dit verhoed.

Holman kom tot die gevolgtrekking dat "daar geen empiriese ondersteuning is vir die wydverspreide idee dat 20 persent van menslike gene gepatenteer word op 'n manier wat onvermydelik geskend sou word" deur moderne genetiese toetstegnologieë nie. Trouens, heelgenoomvolgordebepaling sal binnekort goedkoper wees as diagnostiese toetse, soos Myriad s'n, wat van gepatenteerde gene afhang.

Intussen sal die ongeldig verklaar van menslike geenpatente waarskynlik vordering in die skepping van nuwe mediese behandelings vertraag. Soos Holman opmerk, het die "biotegnologie-industrie baie belê in lewensreddende produkte gebaseer op die verwagting dat effektiewe patentbeskerming beskikbaar is vir innovasies in hierdie veld." Tydens mondelinge argumente het regter Antonin Scalia hierdie hoogs relevante vraag van die ACLU-prokureur gevra: "Hoekom sal 'n maatskappy massiewe belegging aangaan as dit nie kan patenteer nie?" Die prokureur het kreupel geantwoord dat wetenskaplikes sulke werk kan doen "omdat hulle nuuskierig is," "omdat hulle 'n Nobelprys wil hê," en omdat hulle "enorme erkenning sal kry." Scalia het droog geantwoord: "Wel, dis pragtig." Scalia het die regte vraag gevra ter wille van toekomstige pasiënte se welstand, kom ons hoop 'n meerderheid van die Hof kom met die regte antwoord.


Oorsig

Aangesien die meeste van die data wat ons gaan bespreek reeds in die tegniese wetenskaplike literatuur teenwoordig is, is die doel van hierdie hoofstuk om hierdie relatief onbekende en obskure kennis te neem en dit aan te bied op wat ons hoop 'n verstaanbare en toeganklike manier is vir nie -genetici. Om die besonderhede van die genetika van menslike oorsprong in groot diepte uiteen te sit, sal 'n boeklengte-behandeling vereis. Omgekeerd, aangesien die meeste van die inhoud van hierdie boekhoofstuk reeds beredeneer, verdedig en as aparte tegniese referate gepubliseer is, sal ons hier 'n opsomming van hierdie referate verskaf met verwysings vir die meer tegnies-gesinde leser om later te verken.

Omdat die genetika van menslike oorsprong 'n wetenskaplik komplekse kwessie is wat baie vinnig tegnies word, het ons hierdie hoofstuk vereenvoudig deur dit rondom vier hoofvrae te organiseer:

  1. Van wie het mense ontstaan: aapagtige primate of volkome menslike mense?
  2. Hoeveel individue het die menslike ras voortgebring: 'n bevolking of 'n paar?
  3. Wanneer het mense ontstaan: honderde duisende jare gelede of ongeveer 6 000 jaar gelede (d.w.s. oud of onlangs)?
  4. Waar het moderne menslike bevolkings ontstaan: Afrika of Ararat?

Alhoewel spesifieke elemente wat onder elk van hierdie vrae gedek sal word, waarskynlik meer bekend is vir die gemiddelde leser (bv. eise soos "mense is 99% geneties identies aan die ape," "menslike chromosoom 2 is die resultaat van 'n samesmelting," ens. .), het ons gekies om 'n meer omvattende siening eerder as 'n apologetiese gemengde benadering te neem. Ons bedoeling is om te demonstreer dat die Bybelse skeppingsmodel nie net vir 'n handjievol uitgesoekte genetiese waarnemings verantwoordelik is nie, maar ook vir die hele liggaam van genetiese bewyse wat vandag beskikbaar is.


Resultate

Om die vooroordele wat in die ontledings van antieke DNA ingebring is, te evalueer, gebruik ons ​​'n subset van die volgordedata wat gegenereer is as deel van die Neandertal-genoomprojek: 2,8 miljoen lesings van 'n 38 000 jaar oue Neandertal-fossielbeen [9, 10, 16] wat geproduseer is deur haelgeweer 454-volgordebepaling [26] op die GS FLX-platform. Neandertal-data is goed geskik vir die ondersoek van die potensiële effekte van 'n progressief meer ver-verwante vergelykingsgenoom, aangesien volledige genoomvolgorde beskikbaar is van drie groot ape en verskeie meer ver-verwante primate. Deur slegs die toenemend meer ver-verwante genoomvolgorde van menslike [27], sjimpansee [28], orangoetang, rhesus macaque [29], muislemur, bosbaba en muis [30] te gebruik, bepaal ons hoeveel Neandertal-volgordes geïdentifiseer kan word as elke van hierdie genome was die enigste een wat beskikbaar was. Ons het ook die akkuraatheid van die waargenome aantal paarsgewyse nukleotiedverskille in elk van hierdie vergelykings ondersoek ([31].

Met behulp van 'n model van antieke DNA-fragmentasie en deaminering [19], het ons ook datastelle van 100 000 fragmente gesimuleer met vlakke van verskil wat ooreenstem met 1 tot 6 miljoen jaar se afwyking van die menslike afkoms. Die simulasie fasiliteer twee tipes analise. Eerstens, aangesien alle fragmente as endogene hominienvolgorde gesimuleer word, kan ons skat hoeveel endogene fragmente verlore gaan tydens die verskillende stappe van belyning en filtering wat verdere ontledings voorafgaan. Tweedens, met die werklike hoeveelheid volgorde-divergensie wat uit die simulasie bekend is, kan ons ons divergensieskattings direk vergelyk om vooroordele te ontdek en te kwantifiseer. Uit hierdie vergelykings ondersoek ons ​​die doeltreffendheid en akkuraatheid van verskeie filter- en belyningsprosedures om by 'n betroubare divergensieskatting uit te kom.

Opsporing van endogene fragmente

Die eerste stap in die ontleding van antieke DNS-data van haelgeweer is om die teikenspesies (endogene) fragmente te identifiseer. Die primêre doel van hierdie stap is om soveel moontlik endogene fragmente betroubaar te identifiseer. Ideaal gesproke sou hierdie identifikasie nie groot vooroordele inbring wat daaropvolgende ontledings skeeftrek nie.

Teoreties is daar twee maniere om endogene fragmente op te spoor as slegs mikrobiese kontaminasie teenwoordig is. Eerstens kon mikrobiese volgordes aanvanklik geïdentifiseer en dan afgetrek word. Enige nie-mikrobiese volgordes sal dus volgordes van die teikenspesie wees. Alternatiewelik kan endogene fragmente opgespoor word deur ooreenkoms met 'n verwante genomiese volgorde. Terwyl die eerste metode verkieslik is in soverre dit die opsporing van nuwe volgordes en hoogs uiteenlopende streke tussen die teikenspesies en enige vergelykingsgenoom moontlik maak, dui onlangse studies aan dat tans beskikbare mikrobiese volgordedata te onvolledig is om die volle diversiteit wat natuurlik in mikrobiese organismes voorkom op te spoor. gemeenskappe [14, 32]. Daarom is die enigste tans praktiese manier om teikenspesie-DNS-fragmente te identifiseer deur ooreenkoms tussen hierdie en die volgorde van 'n naverwante spesie. Byvoorbeeld, Neandertal-volgordes word geïdentifiseer op grond van hul ooreenkoms met die mens- of sjimpansee-genoom en mammoetvolgordes word geïdentifiseer op grond van die ooreenkoms met die olifantgenoom [9-11, 13, 17]. Die spesifisiteit van hierdie benadering kan verhoog word deur verder te vereis dat ooreenkoms met 'n naverwante genoom hoër is as ooreenkoms met enige bekende mikrobiese volgorde [9, 17].

As gevolg van die algemeen lae persentasie endogene fragmente, veral van minder goed bewaarde, nie-permafrost-afgeleide monsters soos Neandertal-bene, is uitgebreide volgordebepaling nodig om genoeg fragmente te herwin vir daaropvolgende ontledings. Dit vereis op sy beurt aansienlike rekenaarkrag om ooreenkomstesoektogte teen veelvuldige genoomdatabasisse uit te voer. Verskeie wyd gebruikte plaaslike belyningsprogramme bied 'n vinnige vergelyking van reekse met groot databasisse deur 'n kort presiese ooreenstemmende volgorde (saad) te vereis om die belyning te begin [22, 33]. Hierdie heuristiek versnel die soektyd aangesien berekeningsduur belyning beperk is tot rye wat ten minste 'n kort saad deel. Die presiese ooreenstemmende sade wat belyning veroorsaak, word egter skaarser op groter evolusionêre afstande [34], wat die identifisering van sommige ooreenkomste uitsluit. Hierdie erosie van sensitiwiteit word vererger in antieke DNS-haelgeweerdata aangesien, benewens die divergensie na die genoom wat vir vergelyking gebruik word, chemiese skade aan die molekules korter leeslengtes en foutiewe basisse tot gevolg het. Vir ons ontleding poog ons om hierdie effek te minimaliseer deur die saadgrootte so kort te stel as wat rekenkundig haalbaar is. Ons gebruik 'n aaneenlopende saadgrootte van 16 vir Mega BLAST [24].

Met behulp van ons Neandertal-datastel het ons die aantal fragmente gemeet wat as Neandertal geïdentifiseer is deur toenemend verre genome te gebruik vir ooreenkomstesoektogte. Hierdie genoomvolgordes strek oor 'n reeks van minder as 1 miljoen jaar (tussen Neandertal en mens) [9, 10] tot 87 miljoen jaar van divergensie (tussen muis en mens) [35]. Muis-mens-genoom divergensie is geskat op gemiddeld 0,5 substitusies per plek [30]. Dit vorm die mees uiteenlopende genoomvergelyking in ons toets. Deur elkeen van hierdie genome as die soekteiken te gebruik, het ons gevra hoeveel rye as Neandertal identifiseerbaar is. Op hierdie manier kan ons die koste van toenemend ververwante vergelykingsgenome direk bepaal in terme van verlore sensitiwiteit.

Toe ons die menslike genoom as die verwysingsvolgorde gebruik het, het ons geskat dat 'n totaal van 69 959 lesings (of 3,4%) van Neandertale oorsprong was. 'n Verdere 13.6% van alle leesstukke kan geklassifiseer word op grond van ooreenkoms met 'n nie-menslike volgorde in GenBank, insluitend mikrobiese data in die nie-oortollige en omgewingsdatabasisse. Die meerderheid, 83%, het geen betekenisvolle ooreenkoms (e-waarde <0.001) met enige databasisvolgorde gehad nie. Hierdie selfde prosedure is toe uitgevoer deur die genoomvolgorde van die menslike genoomvolgorde onderskeidelik die sjimpansee, orangoetang, rhesus macaque, bosbaba, muis lemur en muis genomiese volgordes te vervang. Soos verwag, verminder beide die aantal fragmente wat geïdentifiseer is en hul plaaslike belyningslengte (Figuur 1a, b) namate verder genome vir soek en belyning gebruik word. Beide waarnemings is toe te skryf aan die belyningsalgoritme wat gebruik is.Eerstens word die korter plaaslike belynings veroorsaak deur die uitbreidingsalgoritme van die plaaslike belyningsprogram, wat die belyning net verleng solank die telling nie met 'n sekere waarde laer as die vorige maksimum telling daal deur verdere basisse in lyn te bring nie [22, 24]. Die verlenging van die belyning sal dus vroeër stop as die teikengenoom meer ver verwant is, wat dus lei tot korter plaaslike belynings. Tweedens sal 'n fragment onopgemerk bly as geen saadpassing gevind word om die belyning te begin nie. Net so kan leeswerk nie 'n belyning produseer met 'n telling wat hoog genoeg is om te vertrou nie.

Aantal belynde antieke DNA-fragmente en gemiddelde volgordelengte. Eienskappe van Mega BLAST-belynings van antieke DNA-volgordes van 'n Neandertal-fossiel tot genoomreekse van toenemende divergensie. Linkerpaneel: aantal lesings met 'n beste trefkrag vir die genoomvolgorde en nie na die GenBank nie-oortollige en omgewingsdatabasisse (geel). Subset van lees met een unieke beste treffer na die verwysingsgenoom (liggroen). Subset van lees met een unieke beste treffer na die verwysingsgenoom wat ten volle belyn kan word met 'n positiewe belyningtelling (donkergroen). Regterpaneel: Gemiddelde lengte van beste plaaslike belynings (geel), gemiddelde lengte van fragmente met 'n unieke beste plaaslike belyning (rooi), gemiddelde lengte van fragmente met 'n positiewe telling wanneer ten volle belyn is met verwysingsgenoom (bruin).

Alhoewel die gemiddelde belyningslengte afneem met verhoogde evolusionêre afstand, neem die lengte van die fragmente waarop hierdie belynings gevind word toe (Figuur 1b). Hierdie oënskynlik paradoksale resultaat kan egter op die volgende manier verduidelik word. Die kans om 'n saadpas te vind en om 'n plaaslike belyning van beduidende ooreenkoms te produseer, neem toe met die lengte van die fragment. Langer fragmente is dus meer geneig om 'n saadvolgorde te hê en dus as Neandertal opgespoor te word. Ter opsomming, plaaslike belyningsprogramme soos Mega BLAST of BLAST produseer belynings wat nie op sigwaarde geneem kan word as 'n beskrywing van die persentasie of lengtes van endogene antieke DNS-volgordes in 'n monster nie, veral wanneer die belynings teen 'n ver-verwante genoomvolgorde is.

Om identifiseerbare antieke Neandertal-volgordefragmente meer volledig te karakteriseer, het ons die effek ondersoek om bloot hierdie plaaslike belynings uit te brei om die hele reeks in te sluit. As gevolg van die biblioteekkonstruksiemetode, weet ons dat herwonne volgordes 'n enkele aaneenlopende DNA-segment van die DNA-ekstrak verteenwoordig, dit wil sê, hulle is nie chimeer nie. Hierdie rye moet dus globaal in lyn gebring word met betrekking tot die ou volgorde, nie plaaslik soos wat met Mega BLAST gedoen word nie. Ons het dus 'n semi-globale belyning algoritme geïmplementeer wat globaal is met betrekking tot die fragment, plaaslik met betrekking tot die genomiese volgorde, en is gesaai deur die aanvanklike plaaslike belyning. Die punteskema vir hierdie belyning gebruik affiene gapingskoste [36]. Slegs reekse met een unieke beste treffer tot die teikengenoom was semi-globaal belyn, aangesien die regte ligging vir veelvuldige ewe goeie treffers onbekend is. Dit lei 'n moontlike komplikasie in as die plaaslike belyning valse ooreenkoms verteenwoordig wat ingebed is binne andersins onverwante volgorde of as 'n indel of ander herrangskikking plaasgevind het in die evolusionêre tyd wat Neandertals en die vergelykende spesies skei. Om te verhoed dat sulke rye ontleed word, het ons vereis dat die algehele semi-globale belyning telling positief bly, dit wil sê dat die volgorde wat deur die plaaslike prosedure nie in lyn gelaat is nie so verskillend was dat die semiglobale belyning meer geneig is om toevallig te voorkom as deur ware evolusionêre verwantskap. Deur hierdie belyningsprosedure te gebruik, het die fraksie van positiewe puntebelynings afgeneem met die mate van divergensie van die verwysingsgenoom (Figuur 1a). Die fragmentlengte van positiewe puntebelynings bly egter meer konstant by toenemende evolusionêre afstand (Figuur 1b). Daarom gee hierdie belyningsprosedure 'n meer akkurate uitbeelding van die lengte van endogene antieke fragmente as eenvoudige plaaslike belyningslengte in gevalle waar die naaste vergelykingsgenoom evolusionêr ver is.

Paarsgewyse verskille

Sodra endogene lesings geïdentifiseer is, kan hul belynings ondersoek word om die gemiddelde aantal verskille per terrein te bereken. Daar is egter verskeie komplikasies vir hierdie ontleding wat spesifiek is vir antieke DNS. Eerstens kan onverwante mikrobiese volgorde valslik as endogeen geklassifiseer word. Tweedens, werklik endogene leeswerk wat hoogs uiteenlopend is, mag dalk nie as sodanig geïdentifiseer word nie. Derdens kan endogene leeswerk korrek geïdentifiseer word, maar verkeerd in lyn gebring word, byvoorbeeld deur by 'n paraloog gebied geplaas te word. Laastens manifesteer nadoodse DNA-skade in verkeerde kodering van letsels. Elkeen van hierdie komplikasies kan die aantal paarsgewyse verskille bevooroordeel: versuim om hoogs divergente lesings te identifiseer, lei daartoe dat paarsgewyse verskille afwaarts bevooroordeel word, terwyl die ander faktore 'n opwaartse vooroordeel tot gevolg sal hê. Gegewe hierdie bronne van foute, het ons die betroubaarheid van waargenome paarsgewyse nukleotiedverskille met betrekking tot toenemende evolusionêre afstand ondersoek.

Uit die belynings wat in die vorige afdeling beskryf is, het ons die verskille tussen Neandertal-volgordes en die genomiese volgorde van spesies met toenemende evolusionêre afstand bereken. Ter vergelyking het ons ook die paarsgewyse nukleotiedverskille tussen mense en verskeie ander spesies bereken wat oor 'n identiese verskeidenheid van divergensie strek met behulp van die data van ewekansig uitgesoekte genomiese streke wat deur die ENCODE-projek verskaf is [37]. Hierdie veel groter streke is voorheen gerangskik en belyn met behulp van die belyningsprogram MAVID [38]. Hierdie datastel het die voordeel dat elke streek reekse bevat met een-tot-een-ortologie tussen mense en die ander belynde spesies en is in hierdie opsig soortgelyk aan ons paarsgewyse volgorde-belynings. Verskilskattings wat deur die MAVID-belyning van hierdie ewekansig uitgesoekte ENCODE-streke gegee word, kan egter moontlik 'n tegniese vooroordeel bevat [39] en moet nie as absolute waarheid beskou word nie. Vir ons doeleindes is dit bloot 'n gerieflike manier om die algemene neiging van toenemende paarsgewyse volgordeverskille tussen evolusionêr meer verafgeleë spesies te meet. Vir hierdie analise gebruik ons ​​nie 'n regstelling vir veelvuldige vervangings nie. Aangesien ons doel is om die uitwerking van verskeie foutbronne te kwantifiseer, sal die interaksie tussen hierdie foute en meer verfynde paarsgewyse divergensiemaatreëls die resultate moeiliker maak om te interpreteer.

Vir elke vergelykingsgenoom het ons gevind dat die waargenome aantal verskille per plek in die plaaslike belynings laer was as die waarde gemeet vanaf die ENCODE belynings. Opmerklik, die waargenome paarsgewyse verskille het selfs afgeneem op die mees ekstreme evolusionêre afstand, dit wil sê na die muis (Figuur 2). Soos voorheen bespreek, aangesien plaaslike belynings nie uitgebrei word na streke van ongelykheid wat die algehele belyningtelling verlaag nie, kan hierdie resultaat maklik verduidelik word. Ongelyksoortige streke word eenvoudig ongelyk gelaat. Die gebruik van die volle semi-globale belynings om paarsgewyse verskille per terrein te meet, lewer waardes wat meer ooreenstem met die ENCODE belynings op toenemende evolusionêre afstand. Ons het ook die effek van die filter van semi-globale belynings vir positiewe telling ondersoek. Ongefiltreerde semi-globale belynings na muis toon 'n aansienlik laer aantal verskille in vergelyking met die verskille wat uit ENCODE streke bereken is. Die lae aantal verskille word hoofsaaklik veroorsaak deur die eerste stap van die analise: die identifikasie van Neandertal-reekse. Die Mega BLAST-metode, wat in hierdie stap gebruik word, is bedoel vir die vergelyking van langer, nou verwante reekse [24] en sal onvermydelik misluk om sommige van die meer uiteenlopende leesstukke op te spoor. Hierdie vooroordeel om meer uiteenlopende leesstukke te identifiseer en in lyn te bring, lei op sy beurt tot die lae aantal verskille. Ons neem die teenoorgestelde effek waar vir belynings vir sjimpansee waar alle belyningsprosedures 'n groter aantal verskille getoon het as wat vir die ENCODE-streke gerapporteer is. 'n Deel van hierdie effek is toe te skryf aan antieke DNA-skade. Oorverteenwoordiging van C->T- en G->A-oorgange in antieke DNA-volgordebepalingsdata is voorheen beskryf as die hoofresultaat van miskoderende letsels [12, 19-21]. Hierdie veranderinge groepeer hoofsaaklik aan die 3'- en 5'-kant van die molekules, waarskynlik as gevolg van enkelstrengige oorhange wat meer vatbaar is vir deaminering aan die einde van die opeenvolgende molekules [19]. Hierdie eienskappe sal semi-globale belynings meer beïnvloed as plaaslike belynings, aangesien eersgenoemde die volle antieke DNS-volgorde insluit, insluitend die punte waar hierdie waninkorporasies volop is. Ons het dus die analise tot transversies beperk en die aantal verskille vir alle verwysingsspesies en ENCODE-streke herbereken (Figuur 2b). Die aantal transversieverskille vir semi-globale belynings met 'n positiewe telling volg die algemene neiging van transversieverskille van ENCODE streekbelynings vir rhesus macaque en sjimpansee. Die waarde vir rhesus macaque stem die naaste ooreen met die verwagting van die ENCODE-belynings. Die aantal transversieverskille na sjimpansee is ongeveer 48% hoër vir die semi-globale gefiltreerde belynings en 21% laer vir plaaslike belynings as die aantal transversieverskille in ewekansig uitgesoekte ENCODE-streekbelynings. Dit demonstreer die probleme met direkte paarsgewyse vergelykings, en beklemtoon die behoefte aan die gebruik van 'n uitgroepvolgorde na die antieke genoom en die naaste verwante genoom vir die meting van divergensie soos bespreek in die volgende afdeling.

Verskille per terrein in belynings van antieke DNA-fragmente. Alle nukleotiedverskille (bo) en transversieverskille (onder) in verskillende belynings na verwysingsgenome van toenemende divergensie. Elke lees word vereis om een ​​unieke beste Mega BLAST-belyning met die verwysingsgenoom te hê (skatting getoon as die swart lyn). Die semiglobale belyning dwing die volle volgorde om in lyn te kom met die genomiese gebied wat deur die plaaslike belyning geïdentifiseer is (skatting as rooi lyn getoon). Hierdie volledige belynings word verder gefiltreer om 'n positiewe belyningstelling (blou lyn) te hê. Die groen kruisies wys die verskille tussen die mens en die verwysingsspesie in die ENCODE veelvuldige volgorde belynings. Die divergensietye op die x-as is vanaf [52] en [35], behalwe vir mens waarvoor ons 'n arbitrêre divergensietyd van 1 miljoen jaar tot Neandertal kies.

Divergensie triangulasie

In gevalle waar die genoomvolgorde van twee naverwante spesies beskikbaar is en een van hulle bekend is dat dit nader verwant is aan die antieke spesie as die ander, is bykomende vergelykings moontlik wat die vooroordele in skattings van divergensie inherent aan antieke DNA kan versag. Neandertalers is een spesie waar twee nabye genoomvolgordes beskikbaar is: mens en sjimpansee. In 'n drie-rigting vergelyking, kan substitusies verdeel word op die onderskeie geslagslyn waarop dit plaasgevind het. Diegene wat spesifiek vir Neandertal is, wat antieke DNA-geassosieerde nukleotied-waninkorporasies en ander volgordebepalingsfoute insluit, kan geïgnoreer word (Figuur 3). Hierdie metode verskaf gerieflik 'n skatting van die aantal veranderinge langs die lyne aan beide menslike en sjimpansee-genome in 'n ongewortelde boom, en omseil grootliks die probleem van nukleotied-waninkorporasies aangesien dit op die Neandertal-lyn geïsoleer is. Dit wil sê, by hierdie posisies sal die Neandertal-basis nie ooreenstem met die mens nóg die sjimpansee nie (behalwe in die seldsame geval van 'n parallelle vervanging in óf die mens óf sjimpansee wat die nukleotied-waninkorporasie in die Neandertal-volgorde weerspieël). As 'n molekulêre horlosie aanvaar word, gee die verhouding van die aantal veranderinge spesifiek aan die menslike geslag tot dié spesifiek vir die sjimpansee-lyn 'n skatting van die Neandertal-menslike divergensie. Met voorafkennis van die divergensietyd tussen die menslike en sjimpansee-genoom, kan 'n divergensietyd op sy beurt aan hierdie vertakkingspunt toegeken word. Hierdie metode is voorheen gebruik om die Neandertal-mens divergensie tyd te skat gebaseer op belynings met menslike en sjimpansee volgordes [9, 10].

Skematiese beskrywing van divergensie triangulasie. (a) 'n Filogenetiese boom wat die nodige topologie uitbeeld vir die toepassing van die divergensie-triangulasiemetode. (b) Die antieke DNS-volgordes word gebruik soos 'n uitgroep na die twee genomiese volgordes in 'n ongewortelde boom. (c) Belynings tussen genomiese volgordes en antieke DNS-fragmente word gebruik om veranderinge aan die afstammelinge toe te ken (nommers aan die regterkant). In hierdie proses kan samevallende veranderinge wat dikwels veroorsaak word deur ou DNA-skade (in rooi in die belynings gewys) lei tot verkeerde toewysings van verskille (in rooi in die opsomming van tabelle) (d) Die toegekende verskille kan gebruik word om 'n divergensie relatief tot die divergensie tussen die twee genoomvolgordes te bereken.

In vergelyking met divergensie skattings gebaseer op die waargenome verskille in 'n paarsgewyse belyning, het hierdie metode van divergensie triangulasie 'n aantal voordele. Soos hierbo beskryf, sal verkeerd gelees basisse in antieke DNA lei tot 'n oorskatting van divergensie in 'n paarsgewyse vergelyking. Aangesien die antieke DNS-volgorde egter gebruik word om veranderinge aan afstammelinge toe te ken, sal 'n fout in hierdie volgorde slegs die divergensieskatting bevooroordeel as dit op 'n plek voorkom met 'n onafhanklike verandering in enige van die twee genomiese volgordes. Ook, terwyl 'n vooroordeel teen hoogs uiteenlopende volgordes sal lei tot 'n onderskatting van divergensie in 'n paarsgewyse vergelyking, bly die divergensieskatting in die triangulasiemetode stabiel solank die vooroordeel beide genome gelyk affekteer.

Ons het die gesimuleerde datastelle gebruik om die stabiliteit van die triangulasiemetode te toets en om verdere filtermetodes te bedink om die akkuraatheid daarvan te verhoog. Die gesimuleerde fragmente is gegenereer om by die waargenome lengteverspreiding van antieke Neandertal-fragmente te pas. Elke simulasiestel het ook 'n vaste gemiddelde divergensie ingebou met behulp van data van die beskikbare mens-sjimpansee heelgenoombelynings [40]. Om die simulasie te voltooi, het ons geslagspesifieke en antieke DNS-geassosieerde vervangings bygevoeg om te modelleer wat in werklike antieke DNS waargeneem word (sien Materiale en metodes). Ons het toe verskeie benaderings van die triangulasiemetode vergelyk om menslike/Neandertal-divergensie te skat en hierdie skatting te vergelyk met die bekende divergensie wat in die gesimuleerde Neandertal-reekse gemanipuleer is.

Ons het die gesimuleerde volgordes in lyn gebring met die menslike en sjimpansee-genome en die GenBank nie-oortollige en omgewingsdatabasisse met behulp van Mega BLAST. Vir ons doel, is belynings vir beide die menslike en sjimpansee genome nodig vir die daaropvolgende stappe van analise en filtering. Ongeveer 99% van die lesings het konsekwent hierdie kriterium vir alle gesimuleerde datastelle geslaag. Die oorgrote meerderheid van die oorblywende leesstukke het geen noemenswaardige plaaslike belyning gehad met enige van die databasisse wat gesoek is nie, of het nie by die sjimpansee óf die menslike genoom belyn nie. Slegs 'n klein persentasie (minder as 0.1% vir alle datastelle, in ooreenstemming met ons e-waarde-afsnypunt) is verkeerd geklassifiseer as gevolg van 'n beste trefkrag vir 'n nie-primaatreeks.

Wanneer kort leesstukke in lyn gebring word met meer ver verwante genome, word hierdie leeswerk nie meer dikwels korrek as Neandertal geïdentifiseer as langer lees nie [41]. Vir die triangulasiemetode kan hierdie effek 'n vooroordeel in die divergensieskatting veroorsaak wanneer dit hoofsaaklik hoogs uiteenlopende leeswerk is wat nie gekarteer kan word nie. Hierdie vooroordeel hang verder af van die metode wat gebruik word om die meervoudige volgorde-belyning te konstrueer. Wanneer die meervoudige volgorde belyning gekonstrueer word deur die antieke volgorde lees na die genoom van spesie A te belyn om endogene lees te identifiseer en dan spesie B word by die belyning gevoeg deur 'n hele genoom belyning tussen die genoom volgordes van A en B te gebruik, die selektiewe vooroordeel teen hoogs uiteenlopende lesings sal lei tot 'n oënskynlike nouer verwantskap tussen die uitgestorwe spesievolgorde en die genoom wat vir identifikasie gebruik word (spesie A). Vir ons gesimuleerde datastelle van 1 tot 6 miljoen jaar is die aantal ongeïdentifiseerde leeswerk na belyning met die menslike genoom oor die algemeen klein en vorm die grootste deel in die groottefraksie onder 35 bp (Figuur S1 in Addisionele lêer 1).

'n Meervoudige volgorde-belyning kan ook onafhanklike belynings tot die genoomvolgorde van beide spesie A en spesie B vereis. In hierdie geval kan die vooroordeel slegs die divergensieskatting beïnvloed as dit een van die twee belynings sterker as die ander affekteer. Dit is die geval as daar meer paarsgewyse verskille aan een van die genoomvolgordes is as vir die ander. Ons datastel wat een miljoen jaar van mens-Neandertal divergensie simuleer, toon so 'n verskil en ons het dit gebruik om vir hierdie vooroordeel te toets. Altesaam 1 130 (1.1%) fragmente kon nie in lyn wees met enige bestaande spesie se genoom in hierdie datastel nie. Hiervan kon 988 gesimuleerde reekse nie net met sjimpansee belyn nie, maar het 'n beduidende belyning met die mens gehad, terwyl 47 fragmente geen beduidende belyning met die mens gehad het nie, maar met sjimpansee belyn. As ons alle fragmente in ag neem wat nie in lyn is nie, neem ons waar dat hierdie fragmente 'n gesimuleerde divergensie van 0,66 miljoen jaar (vertrouensinterval 0,54 tot 0,79) na die mens toon. Daarom veroorsaak die plaaslike belyningsprosedure dat 'n bevooroordeelde subset met hoë divergensie na sjimpansee verlore gaan vir verdere ontleding. Aangesien slegs 'n klein fraksie van lesings egter nie gebruik kan word nie, is die effek op die divergensieskatting van die oorblywende data weglaatbaar, die divergensieskatting vir lesings met belynings vir beide mens en sjimpansee verskil met minder as 1% van die gesimuleerde divergensie. Die gemiddelde grootte van fragmente sonder belyning met menslike en sjimpansee genome, 54 bp, was effens korter as die gemiddelde grootte van 63 bp. Dit dui daarop dat 'n grootte afsny gebruik kan word om hierdie vooroordeel te verlig.

Afgesien van hierdie twee effekte, is 'n grootte-afsnypunt dikwels nodig om ander soogdierkontaminasie van antieke DNS-ontledings te identifiseer en uit te sluit. In 'n toets met mammoet-DNA het ons waargeneem dat leeswerk met 'n lengte van minder as 30 bp dikwels die beste ooreenstem met 'n wye reeks soogdierspesies, terwyl langer rye byna uitsluitlik as mammoet geïdentifiseer word (data nie getoon nie). Dit dui aan dat lees van hierdie grootte te kort is om die oorsprongspesie betroubaar te identifiseer. Vir hierdie studie evalueer ons die invloed van 'n grootte afsnypunt van 35 bp.

Aangesien die gesimuleerde fragmente gebruik word om mens-sjimpansee-verskille te verdeel, is dit van kardinale belang om te verseker dat die belynde mens- en sjimpansee-volgorde ortoloog is [41]. Ons het die hele genoombelynings tussen die menslike en sjimpansee-genoom gebruik om elke unieke beste plaaslike belyningsligging met betrekking tot die ander genoom te karteer (sien Materiale en metodes vir verdere besonderhede). Slegs trefslae wat 'n oorvleueling tussen oorspronklike en gekarteerde ligging in beide rigtings gehad het, is vir verdere ontleding gehou. Ongeveer 88% van lesings in elke datastel het hierdie filter geslaag.Deur die oorspronklike genoomligging vir elke gesimuleerde fragment te gebruik, het ons getoets hoeveel van die oorblywende fragmente nie in lyn was met die ortoloë posisie nie. Tussen 0.2 en 0.3% van die lesings in die gesimuleerde datastel was verkeerd in lyn gebring na filtering. Aangesien die lesings in lyn is met 'n nie-ortoloë ligging, is dit waarskynlik dat 'n byna gelyke tweede beste belyning tot die korrekte ligging of ander soortgelyke streke bestaan. Ons vind dat meer as 95% van die lesings wat in lyn is met 'n nie-ortoloë posisie twee of meer belynings tot die menslike genoom produseer waarvan die bittellings met minder as 6 punte verskil (Figuur S3 in Addisionele lêer 1). Om dus 'n minimum afstand in bittelling tussen die beste en tweede beste treffer te vereis, is baie effektief om die meeste van die oorblywende leesstukke te verwyder wat andersins nie-ortoloë belynings sou produseer.

Met hierdie waarnemings in gedagte, het ons verskeie filters op elk van die gesimuleerde datastelle opgelê nadat ons die menslike, sjimpansee en gesimuleerde Neandertal-reekse in lyn gebring het deur 'n volledige driedimensionele dinamiese programmeringsalgoritme (3DP) te gebruik om vooroordeel te vermy wat deur progressiewe multi-sekwensie-belyning ingestel word. Ons het toe die afwyking van die verwagte divergensie gemeet deur die simulasieparameters (Figuur 4a). Ongefilterde belynings lei tot 'n oorskatting vir laer gesimuleerde divergensie en 'n onderskatting vir hoër gesimuleerde divergensie. 'n Deel van hierdie effek kan verklaar word deur die verskillende belyningsprosedures wat gebruik word om die veelvuldige volgorde-belynings saam te stel: terwyl 'n unieke plaaslike belyning tot die mens vereis word, word die sjimpansee-volgorde bygevoeg vanaf 'n hele genoombelyning. Ons het die effek van ons lengtefilter getoets met uitsluiting van fragmente onder 35 bp. Hierdie filter gee effens hoër divergensie skattings, met die mees noemenswaardige effek gesien by hoër gesimuleerde divergensie tye. Vervolgens het ons die effek van die filter van nie-ortoloë belynings getoets deur die ondubbelsinnige ortologiefilter en die bittelling-filter te gebruik. Na die toepassing van hierdie filterprosedures het alle divergensieskattings toegeneem. Dit het gelei tot 'n oorskatting van divergensie vir klein gesimuleerde divergensie, terwyl hoër gesimuleerde divergensie van 4 tot 6 miljoen jaar in ooreenstemming is met die gesimuleerde waarde. Die kombinasie van alle filtering het 'n soortgelyke afwyking getoon vanaf die divergensie wat in hierdie reekse gemodelleer is.

Divergensieskattings deur triangulasie op gesimuleerde datastelle. (a) 3DP divergensie skattings in vergelyking met die verwagte waardes. Vier stawe word vir verskillende filters geteken: rou skatting sonder filtering op alle unieke belynings (bruin) gefiltreerde belynings met geverifieerde mens en sjimpansee genomiese ligging deur 'n hele genoom belyning en 'n afstand van ten minste 6 punte tussen beste en tweede beste plaaslike belynings se bittellings te gebruik (rooi) belynings van fragmente met 'n grootte >35 bp (oranje) en alle filters toegepas (geel). (b) Beramings word uitsluitlik afgelei van transversieverskille, andersins identies aan (a).

Die oorskatte divergensie vir gesimuleerde data met 'n hoë verskil in lynlengte kan te wyte wees aan onafhanklike maar identiese substitusies in die gesimuleerde data en in een van die uitgroepreekse, wat lei tot wantoewysing van veranderinge. Antieke DNS-skade manifesteer as oorgangsverskille in die antieke DNS-volgorde (C na T en G na A verskille) en oorgange word ook waargeneem as 'n gereelde verskil tussen mens en sjimpansee. Daarom sal hierdie artefak waarskynlik per toeval voorkom. As die vertakkingspunt van die antieke volgorde nie sentraal tussen die twee vergelykende genoomvolgordes geleë is nie, sal die genoom met 'n hoër ware afstand 'n groter kans hê om 'n onafhanklike verandering te toon. Dit lei tot 'n oorskatting van die divergensie na die nader verwante genoom. Aangesien samevallende antieke DNA-skade en onafhanklike sjimpanseeveranderinge waarskynlik meer gereeld sal voorkom vir vinniger-ontwikkelende oorgange, het ons die berekening herhaal op grond van transversieverskille. Die 3DP-belynings het nie betekenisvol verskil van die verwagting vir divergensieskattings gebaseer op transversies as alle filterprosedures toegepas word nie (Figuur 4b). Daarom, onder die toestande van ons simulasie, kan 'n stabiele divergensieskatting bereik word wanneer toepaslike filterkriteria toegepas word om die effek van vooroordele in die belynings, wanbelynings na gelyklopende posisies en samevallende onafhanklike veranderinge te minimaliseer.

Evaluering van potensiële volgordebepalingsteikens

Op grond van ons resultate het ons die haalbaarheid van die hele genoom-haelgeweerbenadering op ander uitgestorwe spesies ontleed. Vir hierdie doel moet verskeie kriteria in ag geneem word. Die eerste stap is natuurlik om 'n monster op te spoor wat endogene DNA bevat. Resultate van dekades lange verkennings van verskillende fossiele dui daarop dat die teenwoordigheid van endogene DNA van twee hooffaktore afhang: ouderdom en bewaringstoestande. Die oudste antieke DNS-volgordes wat tot dusver verkry is, kom uit die slikgedeelte van 'n yskern van Groenland [42] en dateer tot ongeveer 500 000 jaar. In warmer omgewings kan DNA egter baie vinniger afbreek [43]. As gevolg van hierdie beperkings is verskeie potensieel interessante volgordebepalingsteikens waarskynlik tans buite bereik vir antieke DNS-navorsing. Dit sluit in die Homo floresiensis fossiele wat in 'n warm omgewing gevind is, wat waarskynlik die bewaring van endogene DNA uitsluit. Ander argaïese hominiene soos Australopithecus wie se uitwissing die oudste fossiele wat endogene DNS opgelewer het, vooraf dateer, is waarskynlik ook onhandelbaar vir antieke DNS-werk. Aan die ander kant is endogene DNS herwin uit verskeie jonger of beter bewaarde fossiele van 'n wye verskeidenheid spesies, soos grotbere, mammoet, mastodont of sabeltandkatte.

Wanneer 'n goed bewaarde fossiel geïdentifiseer en in volgorde geplaas word, is 'n verwante genoomvolgorde nodig om endogene fragmente op te spoor en kontaminerende volgordes uit te sluit. Soos ons in ons ontleding gewys het, hang die aantal fragmente wat as endogeen geïdentifiseer kan word af van hoe nou verwant hierdie vergelykende genoomvolgorde is. Afgesien van die herwinning van meer volgordes vir die analise, gee 'n nader verwante genoomvolgorde ook 'n meer volledige beeld van die antieke genoom deur 'n vooroordeel teen hoogs uiteenlopende streke te vermy. Dienooreenkomstig beperk die afwesigheid van 'n nabye lewende familielid die waarde van 'n genoomprojek van 'n uitgestorwe spesie aangesien enige volgordevergelyking beperk sal word tot genomiese streke wat voldoende bewaring deel om antieke DNS-volgordes betroubaar op te spoor. 'n Voorbeeld van so 'n spesie is die sabeltandkat. Alhoewel dit potensieel interessant is vir sy unieke morfologiese eienskappe, is hierdie spesie relatief geïsoleer in die filogenetiese boom (Figuur S4 in Addisionele lêer 1). Om hierdie rede kan 'n genoomprojek vir die uitgestorwe sabeltandkat van beperkte waarde wees. Naverwante genome is egter beskikbaar vir verskeie ander uitgestorwe spesies. Die tans voortslepende Neandertal-genoomprojek gebruik die menslike en sjimpansee-genoomvolgorde om endogene Neandertal-fragmente te identifiseer en die onlangs gepubliseerde reekse van 'n mammoet is ontleed deur gebruik te maak van die konsep-Afrika-olifantgenoomvolgorde. Ons het verskeie ander uitgestorwe spesies gelys wie se genoomvolgorde biologies interessant sou wees, tesame met die naaste lewende familielid in Tabel 1.


Homologie in koderende en nie-koderende DNS-volgordes: 'n parsimony perspektief

Vermeende sinapomorfie-assessering (primêre homologie-assessering) is onderskeibaar vir DNS-stringe met 'n kodonstruktuur (hierna kodende DNS) teenoor diegene wat dit ontbreek (hierna nie-koderende DNS). Die eerste vereis die identifikasie van 'n leesraam en van gewoonlik min in-raam invoegings en skrappings. In nie-koderende DNS, waar lengtevariasie baie meer algemeen voorkom, is vermoedelike sinapomorfie-assessering aansienlik minder eenvoudig en hang dit baie af van die belyningsmetode. Met waardering vir die bestaan ​​van evolusionêre beperkings, word belynings wat patrone oorweeg wat met spesifieke vermeende evolusionêre gebeure geassosieer word, bevoordeel. Sodra die rye in lyn gebring is, moet die veronderstelde vermeende evolusionêre gebeure as 'n bykomende stap gekodeer word. Ten einde die belynings en die belyningskodering vervalsbaar te wees, moet dit uitgevoer word deur geregverdigde en eksplisiet geformuleerde kriteria te gebruik. Alternatiewe koderingsmetodes vir die mees algemene patrone teenwoordig in belynings van nie-koderende DNA word hier bespreek. Eenvoudiger vermeende sinapomorfie-assessering sal nie altyd met meer betroubare filogenetiese inligting korreleer nie, want eenvoud korreleer nie noodwendig met die graad van homoplasie nie. Die gebruik van nie-koderende DNS kan tot meer moeisame kodering lei, maar terselfdertyd in meer bevestig hipoteses, wat hul akkuraatheid vir filogenetiese afleiding weerspieël.

Dit is 'n voorskou van intekeninginhoud, toegang via jou instelling.


Die Natuur se Bestemming

Van die onmoontlikheid van evolusie tot die onvermydelikheid van evolusie: Anti-evolusie Michael Denton verander in 'n 'evolusionis'

N resensie deur Gert Korthof
16 Junie 1998 (opgedateer: 22 Feb 2019)

Evolusie: 'n Teorie in krisis 'N ature's Destiny' is een lang argument vir die biosentriese Fine Tuning van die Heelal. In daardie sin is dit 'n baie uitgebreide weergawe van die hoofstuk "The Puzzle of Perfection" in syne Evolusie: 'n teorie in krisis (1986). Die Fine Tuning Argument impliseer egter nie net kosmologiese evolusie nie, maar dit impliseer ook biologiese evolusie. En dit is presies wat sy vorige boek Evolusie: 'n Teorie in krisis op die mees deeglike wyse aangeval. En biologiese evolusie, dit is die algemene afkoms van alle lewe, is presies waarin hy nou verdedig Die Natuur se Bestemming. Nie 'n beperkte weergawe van evolusie nie. Nee, volledige naturalistiese evolusie van anorganiese materiale na die eerste sel na mense.
Daardeur verset hy 'spesiale kreasioniste' soos Phillip Johnson (6) direk. Bo dit beweer hy dat evolusie gerig is en die oorsprong van lewe onvermydelik is as toestande reg is.
Bied hy nuwe feite oor evolusie aan om sy bewering te ondersteun? Leer ons uit sy nuwe boek wat presies fout was met die anti-evolusie-argumente in sy vorige boek?
In my resensie van The Anthropic Cosmological Principle het ek gewonder hoekom anti-evolusioniste soos Johnson, Denton(1986) en Behe ​​nooit die Fine Tuning-argument uitgebuit het om die bestaan ​​van 'n ontwerper te bewys nie. As hulle enigsins geweet het van die Fine Tuning, dan moet die rede wees dat fine tuning evolusie behels en evolusie behels willekeurigheid. En dit is deur die kreasioniste gesien as teenstrydig met 'n doelgerigte heelal. Daarom kon hulle nie die Fine Tuning Argument gebruik nie. Paradoksaal genoeg was 'n argument vir die Ontwerp van die Heelal nie beskikbaar vir kreasioniste nie!
Denton is die eerste anti-evolusionis en anti-Darwinis wat ek ken wat die FT-argument gebruik om die ontwerp van die heelal te bewys. Hy het sy teenstand teen evolusie prysgegee. Dit is niks minder as om van die onmoontlikheid van biologiese evolusie na die onvermydelikheid van evolusie te gaan nie! Hoe kon hy dit doen? Want hy het nie net in sy Evolution: A Theory in Crisis gewys dat die Darwiniaanse meganisme want evolusie kon onmoontlik doen wat dit veronderstel was om te doen, maar ook dat al die biologiese feite gewys het op sy anti-evolusionêre Tipologiese Model, wat die realiteit van (makro-)evolusie ontken het. Volgens Denton (1986) was daar geen tussenprodukte nie, daar was gapings in die fossielrekord proteïenvolgordedata bewys diskontinuïteit op die ou end Darwiniste het nie bewyse vir makro-evolusie verskaf nie, het nie die feit van evolusie vasgestel nie en het nie daarin geslaag om 'n voldoende meganisme te voorsien wat in staat was om transformasie van spesies op 'n makro-skaal. Denton het egter 'n beperkte vorm van evolusie aanvaar: mikro-evolusie. So in Die Natuur se Bestemming hy moes twee van sy eie struikelblokke oorkom: die meganisme en die feit van evolusie. Het hy daarin geslaag en hoe?
Eerstens: die feit van evolusie. In Die Natuur se Bestemming Denton spreek nie die kwessie direk aan nie, daarom is dit moeilik om na een of twee feite te wys wat die verskil gemaak het. Opmerklik genoeg verwys hy na Kauffman (1) en deDuve (2), om aan te toon dat, gegewe die regte begintoestande, die oorsprong van lewe en evolusie onvermydelik is.
Tweedens: die meganisme van evolusie. Denton is duideliker daaroor. Denton bied 'nuwe' bewyse aan vir die toereikendheid van die Darwinistiese meganisme van evolusie (verrassing!) en hy probeer om die willekeurigheid van die Darwinistiese evolusionêre proses te ontsnap deur 'gerigte evolusie' (verrassing!) te postuleer. Hierdie merkwaardige paradigmaverandering van Denton, noodsaak eksklusiewe aandag aan Evolusie in hierdie deel van my resensie.

Wat is sy doelwit? Die doel van Die Natuur se Bestemming is eerstens om die wetenskaplike bewyse aan te bied om te glo dat die kosmos uniek geskik is vir lewe soos dit op aarde bestaan ​​en vir organismes van ontwerp en biologie wat baie soortgelyk is aan ons eie spesie, Homo sapiens, en tweedens dat dit heeltemal ooreenstem met die ouer teleologiese godsdienstige antroposentriese siening van die kosmos.

Waarom impliseer Fine Tuning biologiese evolusie?
Lewe het nie aan die begin van die heelal bestaan ​​nie. Die 'doel' van die fyninstelling is om die produksie van lewe te 'verseker' deur die aanvanklike toestande van die heelal fyn te stel.

Die Natuur se Bestemming. Hoe die Wette van Biologie Doel in die Heelal openbaar.
deur Michael Denton
Die Vrye Pers
1998
454 bladsye

Deel I: Lewe
1. Die Harmonie van die Sfere
2. Die Vital Fluid
3. Die Fiksheid van die Lig
4. Die fiksheid van die elemente en die aarde
5. Die fiksheid van koolstof
6. Die lewensbelangrike gasse
7. Die dubbele heliks
8. Die Nanomanipuleerders
9. Die fiksheid van die metale
10. Die fiksheid van die sel
11. Homo sapiens: Vuurmaker
Deel 2: Evolusie
12. Die Boom van die Lewe
13. Die Beginsel van Volheid
14. Die droom van Asilomar
15. Die oog van die kreef
Gevolgtrekking: Die lang ketting van toeval
Epiloog
Bylaag: Diverse bykomende bewyse van die geskiktheid van die bestanddele van die lewe
Notas
Indeks


Wat is die bewyse vir 'gerigte evolusie'?

Is dit die hele storie?

aanhaling uit die boek:

Kan ons deurslaggewende bewyse in sy boek vind wat hom tot evolusie bekeer het? Die sleutelgedeelte, dink ek, kom voor in die paragraaf "Die nabyheid van alle lewe in DNA-volgorderuimte" van CH 12 (p276). Dit moes gewees het die sleutelinsig vir Denton. Dit lees:

"Een van die mees verrassende ontdekkings wat uit DNA-volgordebepaling ontstaan ​​het, was die merkwaardige bevinding dat die genome van almal organismes is saamgevoeg baie naby saam in 'n klein area van DNS-volgorderuimte wat 'n boom van verwante rye dit kan alles wees onderling omgeskakel via 'n reeks van klein inkrementele natuurlike stappe". [klem is myne]

Ek wens Denton het bewyse hiervoor getoon (9). Dit is neo-darwinisme in 'n neutedop, dit is wat neo-darwiniste die hele tyd aangeneem het! Hy gaan voort:

"Dus die skerp diskontinuïteite, waarna hierbo verwys is, tussen verskillende organe en aanpassings en verskillende tipes organismes, wat die basis van anti-evolusionêre argumente vir die afgelope eeu was (3), het nou baie afgeneem op die DNS-vlak. Organismes wat op 'n morfologiese vlak baie verskillend lyk, kan baie naby aan mekaar wees op die DNS-vlak." [beklemtoning en nota is myne]

Sy grootste struikelblok om in 'n stap-vir-stap verandering van organismes te glo, is dus in stukke geblaas. Dis hoekom hy nou evolusie kan aanvaar. En die spesiale karakter van die DNA-bewyse is, dink ek, dat dit bewyse vir die feit van evolusie (DNS lyk soos 'n boom van rye) en bewyse vir die meganisme van evolusie (DNS is onderhewig aan klein mutasies) verenig. DNA-bewyse is die feit en die meganisme van evolusie.
Is dit die hele storie? Nee. DNA het die potensiaal om die struikelblok van funksionele tussenprodukte te oorkom deur 'ondergronds te gaan': eenvoudig nie in proteïene vertaal word nie. Dan kan dit in enige rigting muteer sonder om skadelik vir die organisme te wees. In Denton se woorde:

"Dus, nuwe organe en strukture wat nie via 'n reeks funksionele morfologiese tussenprodukte bereik kan word nie, kan steeds bereik word deur verandering in DNS-volgorderuimte." (bl. 279)

Tesame met die vorige argument elimineer die hele argument Denton se 'laaste' struikelblok tot evolusie en dus is daar 'niks' wat hom meer verhinder om die feit en meganisme van biologiese evolusie te aanvaar. Hy kon in 1986 geweet het die teoretiese moontlikheid van DNA se kapasiteit, maar is verblind deur selfgekonstrueerde diskontinuïteite in ensieme soos Sitochroom-C. Nou het Denton die feite wat hierdie teoretiese moontlikheid ondersteun: 'n duikers groep sikliede verskil slegs 0,4% in hul DNA, mens en sjimpansee verskil slegs 1% in hul DNA, ens.
Is dit die hele storie? Weereens: NEE. Dit is omdat die Fine Tuning-argument teleologie impliseer, dit is 'n doel, 'n doel, 'n rigting. Die heelal is fyn ingestel vir iets en daardie iets is lewe en mense. Dit is nie regtig versoenbaar met die Darwinistiese proef-en-fout-proses nie! So Denton se aanvaarding van evolusie sou verniet wees? Hy vind steeds die struikelblok wat 'willekeurigheid' genoem word op sy pad na die doelgerigte heelal. Wat is Denton se oplossing? Sy antwoord is: 'gerigte evolusie'.

Kom ons stel weer die probleem: die uitkoms van 'n proef-en-foutproses is onvoorspelbaar. Die bestaan ​​van mense kan 'n gelukkige ongeluk wees. Natuurlike seleksie is ongerig volgens neo-Darwinisme. Die moontlikheid om een ​​of ander ontwerper te laat peuter tydens die evolusionêre proses word geblokkeer deur Denton se verwerping van enige bonatuurlike ingryping (sien aanhaling vanaf bladsy xviii). So waar kom die rigting vandaan? Daar is nie 'n hoofstuk wat aan 'gerigte evolusie' gewy word nie, in plaas daarvan leer 'n mens van 'gerigte evolusie' in Hfst 15, waar hy, merkwaardig genoeg, weer neo-Darwinistiese evolusie uitdaag met nuwe voorbeelde soos die unieke oog van die kreef. en oues soos die voëllong ! Die merkwaardigste verandering is egter, as ons dit vergelyk met Denton (1986), dat die uitdaging nou vir die meganisme van evolusie, nie vir die feit van evolusie. Kom ons kyk na Denton se nuwe logika:

"Weereens, soos in die twee gevalle hierbo aangehaal, is dit moeilik om te glo dat enige soort ongeleide evolusionêre meganisme sou so 'n ongewone aanpasbare einde gerealiseer het." (p360). [beklemtoning is myne]
"Net hoe so 'n ander respiratoriese stelsel geleidelik kon ontwikkel het van die standaard gewerwelde ontwerp sonder een of ander rigting is weereens baie moeilik om te voorsien. " (p 361) [klem is myne].

Wat 'n uitdaging vir evolusie en Darwinisme in 1986 was, is nou bewyse vir gerigte evolusie teen 'n agtergrond van onvermydelike evolusie. Denton hou nie rekening met hierdie paradigmaverandering nie. Dit is duidelik uit hierdie aanhalings alleen dat Denton se 'bewyse' vir gerigte evolusie negatief is. Sommige aanpassings kan nie deur die willekeurige Darwinistiese meganisme verklaar word nie, so hulle moet op een of ander manier 'gerig' wees.'n Voetnoot onthul waar 'rigting' vandaan kom:

“Ons kan so ’n versinsel of peuter van die DNA-ruimte om analoog te wees aan die herrangskikking van die struktuur van die Engelse leksikon om die evolusie van 'n spesifieke woordboom toe te laat, . Deur egter God te speel en die te herstruktureer leksikon ons sou 'n groot woordboom binne die letterspasie kon rangskik, sodat alle funksionele woorde saamgegroepeer is. " [klem is myne] (bladsy 434). (4)

Met DNS-ruimte bedoel hy die stel van alle moontlike DNS-volgordes. My kritiek is dat as die herstrukturering van die leksikon analoog is aan die herstrukturering van die DNS-ruimte, dan kom dit neer op ingryping en sluit Denton ingryping van die begin van sy boek uit. Waarom impliseer dit ingryping? Omdat 'n mens nie die 4 DNS-basisse A,T,C,G kan fyn instel sodat die DNS-reekse beperk word tot maklik omskepbare nuttige DNS-reekse nie. En dit is so omdat die 4 basisse nie en kan nie beperk DNS-volgordes op enige manier. Hoekom? Omdat daar niks in die 4 basisse is wat 'n volgorde ATACGATCGA eerder as CTACGTTACC afdwing nie. Of enige ander volgorde. En dit is noodwendig die geval. Anders sou DNS nie geskik wees vir die taak van inligtingberging nie. Elk van die 4 basisse kan aan elk van die 4 basisse gekoppel word. Elke DNA-volgorde kan met die 4 basisse (8) geproduseer word. Daar is geen beperking in lengte en samestelling nie, wat afkomstig is van die 4 basisse. Die inligting inhoud van DNA is onherleibaar tot die eienskappe van die 4 basisse. Net soos 'n boek nie herleibaar is tot die eienskappe van die alfabet nie. Na my mening is evolusie in wese 'n oop einde avontuur. In teenstelling met Denton glo ek 'n trajek deur DNA-ruimte self kan nie vooraf geprogrammeer word nie. Sien ook sy paragraaf "Beperkings in Sequence Space" (bl. 281), waar hy baie duidelik maak dat hy glo in 'n "pre-arranged DNA sequence space". Nee, beperkings moet gevind word buite die DNA-ruimte. Ek maak nie beswaar teen beperkings nie, maar dit kan nie 'n plaasvervanger vir soek die DNA-ruimte. Denton se aandrang op die peuter met die DNS-ruimte as die hoofmeganisme van 'gerigte evolusie' bots met sy verwerping van onnatuurlike ingrypings. Denton aanvaar veelvuldige voorkomste van knoeiery in die geskiedenis van die kosmos en lewe:
1) peuter met die fisiese konstantes
2) peuter met die chemiese eienskappe van C,N,O,H, ens.
3) peuter met die keuse van die 4 mees doeltreffende basisse wat in DNS ingesluit moet word
4) peuter met die struktuur van DNA (en proteïene)
5) peuter met die DNA-ruimte
Die laaste aksie is sekerlik ingryping. Die kern van die saak is dit: óf fyn instel van aanvanklike toestande is voldoende vir 'n biosentriese heelal óf 'n mens moet gepeuter tydens die evolusionêre proses, wat intervensie is, wat in stryd is met sy naturalisme. Gevolgtrekking: onmoontlik om die 4 basisse A,T,C,G fyn te stel om gerigte evolusie te produseer! Na my mening is daar net een gevolgtrekking oop vir Denton: die ontwerper van die 'Intelligente Design Theorists' (8). En wat kan ek meer sê oor Denton se bewyse vir gerigte evolusie, as wat Denton self sê (op 'n ander bladsy): “Natuurlik bewys hierdie ontdekkings nie gerigte evolusie nie” (p292).
Is Denton 'n Darwinis? Hierbo het ons gesien dat Denton aanvaar het dat organismes geneties gekoppel is (algemene afkoms). In daardie sin is hy 'n evolusionis en 'n Darwinis. In soverre aanvaar Denton egter gerig evolusie, en in sover hy aanvaar dat die verloop van evolusie vooraf geprogrammeer is, en sover aanvaar hy Sheldrake-kragte (p365), en sover hy versiendheid in evolusie verdedig (p362), verwerp hy neo-Darwinisme.

Ek kan nie die hele storie vertel nie, want Michael Denton vertel nie die hele storie nie. Die hele storie sluit antwoorde in op vrae soos: Wat van The Enigma of Life's Origin? Wat van The Tipological Perception of Nature? Wat van The Fossil Record? Wat van The Failure of Homology? Wat van The Biochemical Echo of Tipology? (hierdie is hoofstukke in Evolution: A Theory in Crisis) (5) . Aangesien Denton ons nie daarvan vertel nie, is die enigste ding wat ek kan doen om tussen die lyne te lees. In die 'Nota aan die leser' maak Denton 'n belangrike en onthullende opmerking:

“Omdat die geldigheid van die argument [biosentriese ontwerp van die heelal] afhang van soveel onafhanklike bewyse, word die gevolgtrekking nie wesenlik bedreig nie omdat die hele prentjie nog nie volledig is nie of omdat hierdie of daardie verskynsel soos bv. die oorsprong van lewe of die meganisme van evolusie word nie verstaan ​​nie. Net soos die betekenis van 'n legkaart duidelik kan wees lank voordat al die stukke perfek geplaas is, so vereis my argument ook nie dat alles verduidelik moet word nie." (p xvi.) (beklemtoning myne)

Verskynsels soos die oorsprong van lewe of die meganisme van evolusie was sy vernaamste struikelblokke in Evolusie: 'n teorie in krisis. En nou is hulle net onbeduidende stukkies van die legkaart! Dit is 'n niks minder nie as 'n paradigmaverandering. As hy daardie houding in 1986 gehad het, sou dit geen sin gewees het om te skryf nie Evolusie: 'n teorie in krisis. Boeke soos Evolusie: 'n teorie in krisis is gebaseer op die siening dat solank daar ontbrekende stukke van die legkaart van die oorsprong van lewe is, ons nie die legkaart opgelos het nie en nie geregverdig is om te beweer dat ons die hele prentjie ken nie. Die merkwaardigste ding is dat Denton glad nie verantwoordelik is vir hierdie dramatiese verandering van houding nie. Ons kan net raai dat die gesindheidsverandering volg uit sy aanvaarding van die biosentriese ontwerp van die heelal en die noodsaaklikheid van ontwikkelende lewe. En gevolglik het enige probleme met evolusie nie die ernstige gevolge wat dit in 1986 gehad het nie.
Daar is 'n tweede rede waarom probleme met evolusie nie die impak het wat dit in 1986 gehad het nie en dit is die onvermydelikheid van lewe:

"dat koolstofgebaseerde lewe dus onvermydelik is op enige planetêre oppervlak waar toestande dit toelaat." (bl. 265)

Dit behoort duidelik te wees dat sodra die onvermydelikheid van die oorsprong en evolusie van lewe aanvaar is, alle probleme wat ons het om te verstaan hoe dit het alles gebeur, is nie vervalsings nie, maar 'n teken van ons eie onkunde. Probleme vervals nou nie-gerigte Darwiniaanse evolusie. Een van die pêrels van Denton se insig is dat beide die Darwinistiese en die kreasionistiese wêreldbeskouing die lewe as kontingent sien (p xviii). Darwiniste sien die lewe as 'n ongeluk en kreasioniste sien die lewe as 'n goddelike artefak. Denton se nuwe paradigma is dat lewe onvermydelik is omdat dit vooraf geprogrammeer is in die natuurwette. Ek stem tot 'n groot mate saam met Denton se nuwe evolusionêre paradigma, maar die totale gebrek aan enige eksplisiete verduideliking van wat verkeerd was in Evolusie: 'n teorie in krisis is hoogs onbevredigend. Dit is beslis onbevredigend as mens weet dat Denton (1986) baie misverstande deur nie-bioloë en ander buitestanders veroorsaak het! Laat die leser Denton se wetenskaplike integriteit beoordeel. Vir my is dit oneerlikheid. Die Natuur se Bestemming kon die mees dramatiese en leersaamste weergawe van 'n paradigmaverandering gewees het, as Denton die verandering volledig verantwoord het, as Denton verduidelik wat fout was in Evolusie: 'n teorie in krisis en hoekom, maar hy het nie.

Die geval van die nematode

Ek was verheug oor Denton se storie oor die nematode. Dit het my 'n verrassende nuwe insig gegee, onbedoeld deur Denton, in die langdurige vraag waarom sommige spesies nie oor 'n tydperk van miljoene jare verander nie. In 'n eienaardige paragraaf genaamd "The Genetics and Development of the Nematode" (bl. 334) verduidelik Denton dat die nematode, 'n klein en eenvoudige meersellige wurm, so saamgestel is dat feitlik al die organe intiem met alle ander organe verbind is. of dele van die organisme. Die gevolg is dat feitlik elke (7) mutasie die ontwikkeling en funksionering van die aalwurm sal ontwrig. Hy sê verder dat dit 'n uiterste voorbeeld van "interconnectedness", maar dieselfde interconnectedness is gevind tot 'n sekere mate in die ontwikkeling van alle hoër organismes. [kursief is myne]. My punt is dat die aalwurm steeds 'n aalwurm is (en dit nooit gemaak het om 'n soogdier te word nie) as gevolg van die manier waarop dit saamgestel is! En dat hoër organismes 'n minder onderling verbondenheid het nie per ongeluk nie, maar omdat hul ontwikkeling meer oop is vir verandering! Sodat die graad van ontwikkelingsbeperkings kan 'n pragtige verduideliking wees waarom sommige organismes ontwikkel en ander nie. Die nematode is steeds 'n eenvoudige wurm. Ander eenvoudige organismes het soogdiere geword. Denton het redes gesoek waarom Darwinistiese gradualisme nie kan werk nie, so hy het die moontlike verduideliking oor die hoof gesien waarom daar steeds 'laer' organismes in die omtrek is. Sulke onverwagte insigte maak die boek vir my die moeite werd om te lees.

'n Fassinerende metafisiese verhaal

Hierbo het ek Denton se nuwe evolusionêre sienings bespreek, hier probeer ek die basiese tesis van Die Natuur se Bestemming. Die eerste probleem wat ek het, is dat Denton nie duidelik is oor wat sy basiese tesis is nie: biosentries of antroposentries? My tweede probleem is wat is die natuur van sy basiese tesis? Is dit wetenskap, metafisika of godsdiens?
Ek sal die leser aanraai om aandag te gee aan die manier waarop hy sy proefskrif formuleer. Mens kry meestal die uitdrukking "geskik vir koolstofgebaseerde lewe" "biosentriese aanpassings in die ontwerp van die kosmos"( p14) "die heelal is diep biosentries en gee elke voorkoms van spesiaal ontwerp vir lewe."(p16). Maar ook: "Die basiese tesis van die boek, dat die kosmos uniek geskik is vir mens bestaan" (xii). Merkwaardig, wanneer dit kom by 'n formulering van 'n falsifiseerbare wetenskaplike hipotese wat hy gee: "die kosmos is uniek geskik vir lewe" (p386) in plaas van "uniek geskik vir mense"My punt is dat Denton maklik wissel tussen lewe en mens en meestal gebruik lewe. Waarom nie konsekwent beweer 'die kosmos is antroposentries' nie? 'n Biosentriese kosmos sal nie 'n teïs bevredig nie. Die aarde met lewe, maar sonder menselewe, sou 'n mislukking wees.

Bewyse

Ek dink Denton maak nie konsekwent aanspraak op antroposentriese fine tuning nie, want die bewyse is genoeg vir lewe, maar nie-bestaande vir mens fyn instelling. Sy argument vir antroposentriese ontwerp sou oortuigend wees as hy eienskappe van die natuur kon gee spesifiek en eksklusief ontwerp vir mense en nie vir sjimpansees of lugasemende organismes nie. Maar hy doen nie en hy kan nie. Dit sal moeilik wees, indien nie onmoontlik nie, want mense en sjimpansees verskil geneties slegs 1%. Denton skryf dat "Ses aanpassings is wyd aangehaal as deurslaggewend vir die unieke sukses van ons spesie: intelligensie, taal, goeie visie, die hand, regop loop, sosiaal." Geen probleem daarmee nie. Maar daardie kenmerke is evolusionêre aanpassings onder die invloed van natuurlike seleksie en is geen voorbeelde van fyn afstemming van fisies-chemiese wette nie. Uit die feit dat die menslike spesie 6 unieke aanpassings het, sou ek aflei dat die oorsprong van die menslike spesie onwaarskynlik is. Trouens, Denton stem met my saam, want hy gee 'n kans van een uit 'n miljoen vir die oorsprong van Homo sapiens op 'n aarde-agtige planeet (p388). Dit is beswaarlik 'n onvermydelike gebeurtenis! Verder verwar Denton ons regtig wanneer hy 'Traagheid'(!), 'Die spoed van senuwee-geleiding', 'Die grootte van senuwee-aksone', ens. in die hoofstuk 'Homo Sapiens'. Hierdie onderwerpe behoort nie uitsluitlik aan mense nie, maar deur dit in die hoofstuk te plaas, stel Denton voor dat hulle dit wel doen. Wanneer gaan ’n skrywer opstaan ​​wat op ’n onbevooroordeelde manier oor hierdie sake skryf? (14)
Toe ek in hoofstuk 15 sy verhaal oor die buitengewone oog van die kreef lees, en ek besef dat die kreef in besit is van die enigste perfekte natuurlike vierkant in die kosmos, kan ek een en net een gevolgtrekking maak: die heelal is ontwerp met die kreef in gedagte.

Die aard van sy eis

  • CH 2: spring van fiks na 'die wette van die natuur is gerangskik vir koolstofgebaseerde lewe' (p19)
  • CH 4: spring van fiksheid na 'die onvermydelike einde van natuurwette' (p71)
  • CH 5: spring van toevallighede na ''n kosmos aangepas vir koolstofgebaseerde lewe' (p101)
  • CH 6: spring van eienskappe van suurstof na aanpassings van suurstof (p117)
  • CH 9: spring van chemiese eienskappe van metale na "besondere metale is aangepas vir spesifieke biologiese prosesse" (p195).
Alhoewel hy hierdie soort bevoordeel interpretasie, hy gebruik dit nie as 'n verduideliking. In plaas daarvan gebruik hy 'n oorsaaklike verklaring. En vir my wys dit dat biosentriese 'verduidelikings' glad nie verduidelikings is nie. En dit is omdat die biosentriese teorie 'n metafisiese wêreldbeskouing is, wat nie wetenskaplike verduidelikings toelaat nie. As bogenoemde teleologiese verduideliking absurd klink, is dit presies die rede waarom teleologiese verklarings lank gelede uit fisika uitgeskakel is. Help dit as ons weet dat fisiese konstantes vir lewe ontwerp is? Help 'n teleologiese verduideliking ons om te verstaan die meganisme en prosesse onderliggend aan die gedrag van die son ? Natuurlik nie! As dit wetenskaplik bruikbaar is, behoort die teleologiese verduideliking in staat te wees om vraag soos: Waarom bestaan ​​daar bestraling skadelik vir die lewe hoegenaamd in 'n sogenaamde biosentriese heelal? en: As die son se doel is om nuttige energie vir lewe op aarde te lewer, hoekom enigsins skadelike straling uitstraal? "Die son se ultraviolet lig is die hoofskuldige wat genetiese mutasies in velselle veroorsaak het." (12)
George C. Williams het 'n argument ontwikkel in Beplan en Doel in die Natuur (13) , wat ek nie kan vergeet nie. As die son bestaan ​​om die planeet aarde te dien, vra hy, hoekom moet die son in alle rigtings straal? Gevolglik is die aarde in staat om minder as 'n biljoenste van die son se lig te onderskep. Die res word in die ruimte in alle rigtings uitgestraal (vir geen gebruik). Die doeltreffendheid van die son se gebruik van energie om die aarde te verlig, is mikroskopies klein. Duidelik 'n verkwistende ontwerp! Ek kan byvoeg dat, aangesien die son 'n beperkte leeftyd en eindige hulpbronne het, dit twyfelagtig lyk of die son se doel is om 'n konstante vloei van energie na die aarde te lewer vir 'n onbeperkte tyd. Williams stel voort dat 'n weerkaatser die doeltreffendheid van die son sterk sal verbeter. 'n Weerkaatser? Ja, dit is wat 'n menslike ingenieur sal gebruik om verkwistende bestraling in alle rigtings te voorkom. So hoekom kon die son-ontwerper nie 'n weerkaatser gebruik nie? Waarom sulke beperkings op die ontwerp van die son plaas? Denton bespreek nie hierdie ondoeltreffendheid nie. Denton bespreek glad nie hoe 'n mens die ontwerp-kriteria van die son-ontwerper kan vasstel nie, wat nog te sê op 'n voldoende presiese manier om die soort besware wat Williams gemaak het, te hanteer.
Hierdie oorwegings is verdere bewyse dat Denton se biosentriese teorie glad nie 'n wetenskaplike teorie is nie. Denton se gevolgtrekking 'Kosmologies Fitness by Design' is regtig nie veel anders as 'Biologiese fiksheid deur Ontwerp'. En die laaste konsep is bonatuurlike skepping van biologiese spesies. 'Fitness by design' is neo-kreasionisme, is metafisika, val buite die wetenskap. Die inkonsekwentheid in Denton se verhaal is dat 'ontwerp' bots met "die basiese naturalistiese aanname van moderne wetenskap." (p xviii), wat hy aanvaar het. Een verskil met kreasionisme is dat Denton die bonatuurlike by die oorsprong van die heelal plaas en die aantal ingrypings tot een verminder. Nog 'n verskil is dat hy evolusionêre prosesse nodig het om lewe voort te bring op grond van die aanvanklike fyn ingestelde toestande, wat baie meer ambisieus is as enige kreasionistiese scenario. Wetenskap sal 'n paar eeue nodig hê om uit te vind hoe lewe gegenereer word op grond van 'n aanvanklike stel fisiese toestande.
Denton het 'n mooi storie vertel wat deur baie wetenskaplike feite geïnspireer is, maar sekerlik 'n metafisiese storie. 'n Fassinerende metafisiese verhaal wat mense in verband bring met baie besonderhede van die kosmos. Hy het getoon dat baie onverwagte fisiese besonderhede van die heelal wel saak maak vir die menslike bestaan.

Is DNA uniek geskik vir sy taak?

22 Feb 2019 In Hoofstuk 7 bespreek Denton die vraag of DNS uniek geskik is vir sy taak as draer van genetiese inligting. Mens sou reageer: natuurlik is dit pas, anders sou ons nie hier wees nie en sou daar nie 'n miljoen spesies bestaan ​​wat almal op dieselfde molekule-DNS gebaseer is nie. Maar selfs al was DNS uniek geskik vir sy taak, hoekom kon dit nie deur natuurlike seleksie verklaar word nie?

Dit is nie wetenskaplik onsin om te sê dat sommige eienskappe van DNS optimaal is nie. Byvoorbeeld, wiskundige simulasies dui daarop dat die 3-dimensionele verpakking van DNA optimaal is (15) . Nog 'n merkwaardige eienskap van DNS (nie bekend toe Denton sy boek geskryf het nie) is hoe DNS homself beskerm teen skade deur ultraviolet lig. Wanneer 'n basis deur UV-lig getref word, gaan dit 'n opgewekte toestand binne, maar keer binne 290 - 720 femtosekondes terug, dit is baie vinnig (!), na sy grondtoestand. Die gevolg is minder skade. Hierdie fotostabiliteit sou des te meer krities gewees het toe die eerste lewe op Aarde verskyn het, want daar was geen noemenswaardige osoonlaag in die atmosfeer om teen ultravioletstraling te beskerm nie (18) . Natuurlik bly die vraag waarom die wette van fisika so ontwerp is dat ultravioletstraling in die eerste plek DNS beskadig.

'n Verdere ope vraag is dit: wat presies is die taak van DNS? Sluit dit mutasie in? Herkombinasie? Indien wel, hoeveel? Sonder om die taak presies te spesifiseer, is dit betekenisloos om te beweer DNS is uniek geskik vir sy taak.

Om terug te keer na die deurslaggewende vraag: is DNA uniek geskik? Dit is: is daar beter alternatiewe? Om daardie vraag te beantwoord, moet ons weet wat die alternatiewe molekules is? As die natuur nie daardie alternatiewe vervaardig het nie, moet chemici dit doen. Die alternatiewe word XNA's (27) genoem (nie aan Denton bekend nie omdat hulle te onlangs geskep is). Denton haal die gevolgtrekking van die DNS-chemikus W. Saenger (10) aan: geen beter alternatief is gevind vir die basisse en die suiker-fosfaat-ruggraat van DNS nie. Alle teoretiese alternatiewe het blykbaar nadele. ’n Effens ander vraag is: het DNA nadele? Die antwoord moet duidelik ja wees. Sitosien is inherent onstabiel, en kan verander in uracil (spontane deaminering). Dit kan tot 'n puntmutasie lei as dit nie herstel word deur die DNA-herstel-ensieme soos uracil-glikosilase, wat 'n uracil in DNA klief (wiki). Denton noem dit nie.

Die basisse
Is daar alternatiewe vir die 4 basisse A, T, C, G? Denton stel dat 'n denkbeeldige 6-basis sisteem (3 paar basisse) slegs hipoteties is (p. 164). Maar onlangs Wetenskap (16) het berig dat die Romesberg-Schultz-span 'n nuwe basis genaamd "PICS" ontwerp het en dit in DNS geïnkorporeer het en gewys het dat die nuwe DNS met 'n nuwe DNS-polimerase gerepliseer kan word. Verder het 'n span Japannese ondersoekers (19) twee sintetiese komplementêre basisse S en Y bekend gestel. DNS-molekules wat op hierdie manier gemodifiseer is, het normale dubbele helikse gevorm met S-paring met Y.Die vier basisse A, T, C, G is dus nie uniek geskik vir die vorming van DNA nie.
In 2003 Haibo Liu et al (22) het 'n DNS gerapporteer wat al vier basispare deur nuwe, groter pare vervang het. Die uitgebreide dubbelhelikse is meer termodinamies stabiel as die Watson-Crick-heliks. Die nuwe pare vorm blykbaar waterstofbindings analoog aan die natuurlike Watson-Crick-pare. Die nuwe basisse koppel met die natuurlike basisse, dus DNS met 8 basisse kan bestaan ​​en het 'n verhoogde potensiaal vir enkodering van inligting. Die skrywers kom tot die gevolgtrekking dat daar geen oënskynlike verbod is teen genetiese stelsels wat verskillende groottes as die natuurlike een het nie. Weereens word Denton se bewering dat die 4 natuurlike basisse uniek geskik is vir die vorming van DNA, weerlê. Die vraag bly staan ​​of hierdie gemodifiseerde basisse natuurlik kan voorkom (oorsprong van lewe probleem) en ons benodig inligting oor hoe hierdie vorm van DNS met (gemodifiseerde) histone verpak kan word om 'n chromosoom te vorm.


Gemengde DNA. A en T is natuurlike basisse, xA en xT is gemodifiseerde basisse. Syfers uit: Liu et al (2003) 22.

xDNA.


TNA en RNA ©Science 25

Lynch et al (2006) (23) noem hul uitgebreide DNA xDNA. xDNA het 'n ekstra benseenringe, vier moontlike basispare, merkwaardige stabiliteit, spontane samestelling en potensiaal om die genetiese alfabet uit te brei. Daar is ook probleme: die ontwikkeling van 'n polimerase wat in staat is om die dupleks te repliseer.

In 2019 het navorsers 'n genetiese stelsel geskep met agt boustene A, T, G, C, P, Z, B, S (Hachimoji DNA en RNA). Hulle het getoon dat die 4 ekstra basisse nie die 3-dimensionele struktuur van DNA versteur het nie, dat die nuwe basisse paar, dat die nuwe DNA gerepliseer kon word, na RNA getranskribeer kon word met 'n gemodifiseerde RNA-polimerase, en dit is veranderbaar en ondersteun Darwinistiese evolusie ( 29 ).

Ruggraat: die suikerkomponent
Wat van die ribose-komponent van DNA? Schöning et al (17) het 'n chemiese analoog van RNA gesintetiseer, wat afgelei is van 'n suikerring wat 4 koolstofstowwe (tetrose) bevat in plaas van die meer gewone 5 wat in ribose (pentose) voorkom. Hierdie eenvoudige RNA genoem Threose Nucleic Acid of TNA, kan vorm stabiel dubbele helikse met homself en ook met komplementêre RNA's en DNA's. Die kruisparingseienskappe en die eenvoud van sy selfsamestelling maak TNA 'n goeie kandidaat vir 'n natuurlike nukleïensuur en 'n moontlike voorloper van DNA. Deoksi-ribose kan vervang word deur 'n eenvoudiger suiker: threose. Hierdie soort DNS, genoem TNA, kan deur natuurlike ensieme saamgestel word. Die wonderlike ding van TNA is dat alhoewel die suiker-fosfaat-ruggraat een koolstofatoom korter is as RNA of DNA, dit steeds uitstekende basisparing toon (20). Verder, tetrose suikers is eenvoudiger as die vyf-koolstof pentose suikers gevind in beide DNA en RNA en kan makliker saam te stel in 'n prebiotiese wêreld, uit twee identiese twee-koolstof fragmente volgens John Chaput (24). Verder kan 'n enkele string TNA inderdaad met beide DNA en RNA bind deur Watson-Crick basisparing wat 'n hibriede DNA-TNA string vorm. Dit dui op 'n moontlike oorgang na die standaard RNA- en DNA-wêreld. Verder kan TNA in tersiêre strukture vou wat komplekse funksies net soos RNA kan verrig (24).

Daar is ander alternatiewe vir DNA: Peptied Nucleic Acid (PNA) en Glycol Nucleic Acid (GNA). Sien vir onlangse oorsig: 'Primitiewe Genetiese Polimere' (26). Sien ook: Nukleïensuur-analoë (wiki).

Wat van aminosure? Daar is 20 aminosure wat in proteïene voorkom. Kan ander aminosure in proteïene geïnkorporeer word? Die Schultz-span het nou meer as 80 verskillende nie-natuurlike aminosure by proteïene gevoeg. Ken et al het 'n tegniek ontwikkel wat die eukariotiese genetiese kode moontlik uitbrei met 'n arbitrêre onnatuurlike aminosuur (21, 28). So duidelik is daardie 20 nie die enigste moontlike aminosure nie.


Skrywer Opsomming

In onlangse dekades het wetenskaplikes genetiese volgordes—DNA, RNA en proteïenvolgordes—uit talle organismes onttrek. Hierdie rye bevat die inligting vir die konstruksie en funksionering van hierdie organismes, maar tot dusver is ons meestal nie in staat om dit te lees nie. Dit is lank reeds bekend dat hierdie reekse baie soorte "motiewe" bevat, dit wil sê herhalende patrone, wat met spesifieke biologiese funksies geassosieer word. Daar is dus baie navorsing aan rekenaaralgoritmes gewy om subtiele, herhalende motiewe in rye outomaties te ontdek. Vorige algoritmes soek egter na rigiede motiewe waarvan die gevalle slegs deur vervangings verskil, en nie deur invoegings of skrappings nie. Werklike motiewe is buigsaam en wissel deur invoegings en skrappings. Hierdie studie beskryf 'n nuwe rekenaaralgoritme vir die ontdekking van motiewe, wat arbitrêre invoegings en skrappings moontlik maak. Hierdie algoritme kan werklike, buigsame motiewe ontdek, en behoort ons te kan help om die funksies van baie biologiese molekules te bepaal.

Aanhaling: Frith MC, Saunders NFW, Kobe B, Bailey TL (2008) Ontdek volgordemotiewe met arbitrêre invoegings en skrappings. PLoS Comput Biol 4(5): e1000071. https://doi.org/10.1371/journal.pcbi.1000071

Redakteur: Gary Stormo, Washington Universiteit, Verenigde State van Amerika

Ontvang: 4 September 2007 Aanvaar: 27 Maart 2008 Gepubliseer: 9 Mei 2008

Kopiereg: © 2008 Frith et al. Hierdie is 'n ooptoegang-artikel wat versprei word onder die bepalings van die Creative Commons Erkenningslisensie, wat onbeperkte gebruik, verspreiding en reproduksie in enige medium toelaat, mits die oorspronklike outeur en bron gekrediteer word.

Befondsing: MCF is deur AIST ondersteun. NFWS en BK is deur die Australiese Navorsingsraad (LNR) en die Nasionale Gesondheids- en Mediese Navorsingsraad (NHMRC) ondersteun. BK is 'n LNR Federasie Genoot. TLB is ondersteun deur NIH-toekenning R0-1 RR021692-01 en deur die Australiese Navorsingsraad Sentrum van Uitnemendheid in Bioinformatika.

Mededingende belange: Die skrywers het verklaar dat geen mededingende belange bestaan ​​nie.


Inleiding

Menslike genetiese identifikasie vir forensiese doeleindes word verkry deur die definisie van genetiese profiele. 'n Genetiese profiel of die genetiese vingerafdruk van 'n individu is die fenotipiese beskrywing van 'n stel genomiese lokusse wat spesifiek vir daardie individu is. In ooreenstemming met internasionale aanbevelings, veral met aanbevelings van die European DNA Profiling Group (EDNAP), moet tans slegs genetiese profiele wat verkry word van outosomale kort tandem-herhalings (STR) vir genetiese vingerafdrukke gebruik word. In 'n aansienlike aantal situasies van menslike identifikasie is outosomale DNA egter hoogs afgebreek of is glad nie beskikbaar nie. In hierdie gevalle kan die studie van mitochondriale DNA (mtDNA) vir menslike identifikasie die laaste aantrekkingskrag wees en het daarom roetine geword (Budowle et al., 2003). Nietemin, en ten spyte van die robuustheid van mtDNA in gevalle van uitsluiting of afwesigheid van identiteit tussen volgordes, wanneer die resultate volgorde-identiteit is, in teenstelling met kernmerkers, verwys hulle nie na 'n individu nie, maar na 'n groep individue van dieselfde moederlike afkoms.

Opnamemetodologie

Ons het stelselmatig met PubMed Advanced Search Builder gesoek na vraestelletitels met die volgende kombinasies: (1) mitochondriale DNA en biologie, (2) mitochondriale DNA en riglyne, (3) mitochondriale DNA en nomenklatuur, (4) mitochondriale DNA en volgordebepaling, (5) ) mitochondriale DNS en databasis, (6) mitochondriale DNS en data, (7) mitochondriale DNS en identifikasie, (8) mitochondriale DNS en forensies. Vraestelle wat nie met menslike of dierlike mitochondriale DNA verband hou nie, is uitgesluit. Ons soektog is nie verfyn deur publikasiedatum, joernaal of impakfaktor van die joernaal, skrywers of skrywersaffiliasies nie. Daarbenewens het ons gebruik Riglyn dokumente van die Internasionale Vereniging vir Forensiese Genetika beskikbaar by https://www.isfg.org/.

Mitochondriale DNA biologie en genetika

Mitochondria is sellulêre organelle wat 'n ekstrachromosomale genoom bevat, wat beide verskillend en apart van die kerngenoom is. Die mitochondriale DNS (mtDNA) is vir die eerste keer in 1963 deur Margit Nass en Sylvan Nass geïdentifiseer en geïsoleer, wat sommige mitochondriale vesels bestudeer het wat volgens hul fiksasie, stabilisering en kleuringsgedrag DNS-verwant blyk te wees (Nass & Nass, 1963). Die volledige volgorde van die eerste mtDNA is egter eers agtien jaar later, in 1981, gepubliseer en as die mtDNA Cambridge Reference Sequence (CRS) gevestig (Anderson et al., 1981).

In wese is die mtDNA 'n vyf mm histoonvrye sirkelvormige dubbelstring-DNS-molekule, met ongeveer 16 569 basispare en weeg 10 7 Daltons (Taanman, 1999). mtDNA-stringe het verskillende digthede as gevolg van verskillende G+T-basissamestelling. Die swaar (H) string kodeer meer inligting, met gene vir twee rRNA's (12S en 16S), twaalf polipeptiede en veertien tRNA's, terwyl die ligte (L) string agt tRNA's en een polipeptied kodeer. Al die 13 proteïenprodukte is deel van die ensiemkomplekse wat die oksidatiewe fosforileringstelsel uitmaak. Ander kenmerkende kenmerke van die mtDNA is die intronlose gene en die beperkte, of selfs afwesige, intergeniese volgordes, behalwe in een regulerende gebied.

Die mitochondriale D-lus is 'n driestrengige streek wat in die hoof nie-koderende gebied (NCR) van baie mitochondriale genome voorkom, en word gevorm deur stabiele inkorporering van 'n derde 680 basisse DNA-string bekend as 7S DNA (Kefi-Ben Atig et al., 2009). Die oorsprong van replikasie is geleë by die nie-kodering of D-lus streek, 'n 1 121 basispare segment wat geleë is tussen posisies 16 024 en 576, volgens die CRS numerasie (Anderson et al., 1981) (Fig. 1) ). Die D-lus-streek bevat ook twee transkripsie-promotors, een vir elke string. Nukleotiedposisies in die mtDNA-genoom word genommer volgens die konvensie wat deur Anderson et al. (1981), wat effens gewysig is deur Andrews et al. (1999), wat die vervanging van CRS vir rCRS (hersiene Cambridge Reference Sequence) bepaal. Meer presies, die numeriese benaming van elke basispaar word geïnisieer op 'n arbitrêre posisie op die H-string, wat daarna voortgaan en rondom die molekule vir ongeveer 16 569 basispare.

Figuur 1: Die menslike mitochondriale DNA-genoom met gene en kontrolestreke gemerk.

Die oënskynlike gebrek aan mtDNA-herstelmeganismes en die lae getrouheid van die mtDNA-polimerase lei tot 'n aansienlik hoër mutasietempo in die mitochondriale genoom, in vergelyking met die kerngenoom. Byvoorbeeld, Sigurğardóttir en medewerkers het die mutasietempo in die menslike mtDNA-beheergebied op 0,32 × 10 −6 /perseel/jaar geskat (Sigurðardóttir et al., 2000) wat vergelyk word met 0,5 × 10 -9 /perseel/jaar in die kerngenoom (Scally, 2016). Die meeste van die volgordevariasie tussen individue word gevind in twee spesifieke segmente van die kontrolegebied, naamlik in die hiperveranderlike streek 1 (HV1, posisies 16 024 tot 16 365) en in die hiperveranderlike streek 2 (HV2, posisies 73 tot 340) (Greenberg) , Newbold & Sugino, 1983). ’n Derde hiperveranderlike streek (HV3, posisies 438 tot 574), met bykomende polimorfiese posisies kan nuttig wees in die resolusie van ononderskeibare HV1/HV2-monsters (Lutz et al., 2000). Die klein grootte en relatief hoë interpersoon-veranderlikheid van die HV-streke is baie nuttige kenmerke vir forensiese toetsdoeleindes.

Die mtDNA-volgorde definieer die individuele haplotipe wat deur die verskillende basispare gerapporteer word relatief tot die rCRS mtDNA-volgorde. Die versameling soortgelyke haplotipes wat gedefinieer word deur die kombinasie van enkelnukleotied polimorfismes (SNP's) in mtDNA wat van 'n gemeenskaplike voorouer geërf is, definieer 'n haplogroep wat gevorm is as gevolg van die opeenvolgende akkumulasie van mutasies deur moederlike afkoms (Mitchell et al., 2015).

’n Mitochondrion bevat 2 tot 10 kopieë van mtDNA en elke somatiese sel kan tot 1 000 mitochondria hê (Elson et al., 2001 Wei et al., 2017). Dus, wanneer die hoeveelheid van die onttrekte DNS redelik klein of afgebreek is, is dit meer waarskynlik dat 'n DNS-tiperesultaat verkry kan word deur die mtDNA te tik as deur polimorfiese streke wat in kern DNS voorkom, te tik.

In teenstelling met die kern-DNS, word die mtDNA uitsluitlik moederlik geërf, wat die feit regverdig dat, afgesien van mutasie, die mtDNA-volgorde van broers en susters en alle moederlike familielede identies is (Case & Wallace, 1981 Giles et al., 1980 Hutchison et al., 1974). Hierdie spesifieke eienskap kan baie nuttig wees in forensiese gevalle, soos in die ontleding van die oorskot van 'n vermiste persoon, waar die bekende moederverwante 'n paar verwysingsmonsters kan verskaf vir 'n direkte vergelyking met die mtDNA-tipe. As gevolg van die gebrek aan rekombinasie, kan moederverwante van verskeie generasies afgesien van die bron van bewyse (of biologiese materiaal) vir verwysingsmonsters gebruik word (Case & Wallace, 1981 Giles et al., 1980 Hutchison et al., 1974).

Die haploïede en monoklonale aard van die mtDNA in die meeste individue vereenvoudig die proses van interpretasie van die DNS-volgordebepalingsresultate. Tog is dit moontlik om heteroplasmie in af en toe gevalle te vind (Bendall, Macaulay & Sykes, 1997 Bendall & Sykes, 1995 Comas, Paabo & Bertranpetit, 1995 Gill et al., 1994 Ivanov et al., 1996 Wilson et al., 1997) . 'n Persoon word as heteroplasmies beskou as sy/hy meer as een waarneembare mtDNS-tipe dra. Daar is twee klasse van heteroplasmie, wat verband hou met lengte polimorfismes en puntsubstitusies. Slegs laasgenoemde is belangrik vir forensiese menslike identifikasie. Die meeste forensiese laboratoriums wêreldwyd rapporteer nie lengte-polimorfismes nie en die riglyne oor menslike identifikasie met mtDNA wys dit nie as verpligte inligting nie (Parson et al., 2014 Prinz et al., 2007). Verder het die inligting van lengte polimorfismes geen impak in haplogroepe se definisie nie.

Heteroplasmie manifesteer hom op diverse maniere (Stewart et al., 2001). 'n Individu kan meer as een mtDNA-tipe in 'n enkele weefsel toon. 'n Individu kan in een weefselmonster heteroplasmies wees en in 'n ander een homoplasmies. Laastens kan 'n individu een mtDNA-tipe in een weefsel vertoon en 'n ander tipe in 'n ander weefsel. Van die drie moontlike scenario's is die laaste een die minste geneig om te voorkom. Wanneer heteroplasmie in die mtDNA van 'n individu gevind word, verskil dit gewoonlik op 'n enkele basis, in HV1 of HV2.

Heteroplasmie is waargeneem by posisie 16 169 van die mtDNA-beheerstreek in die vermeende oorblyfsels van tsaar Nicholas II van Rusland en sy broer, die groothertog van Rusland Georgij Romanov (Gill et al., 1994 Ivanov et al., 1996). Comas, Paabo en Bertranpetit (1995) het op hul beurt heteroplasmie op twee verskillende posisies, 16, 293 en 16,311, in die mtDNS van 'n anonieme skenker se geplukte hare opgespoor. Wilson et al. (1997) het 'n gesin gevind wat saamgestel is uit 'n moeder en twee kinders wat 'n heteroplasmiese mtDNA op posisie 16,355 in beide bloed- en bukkale deppermonsters dra.

Die bestaan ​​van heteroplasmiese individue en die beperkte kennis oor beide die meganisme en die tempo van heteroplasmie kan kwessies wees wat geopper word in 'n poging om mtDNA-bewyse van forensiese ondersoeke uit te sluit. Heteroplasmie op een nukleotiedposisie word meer gereeld in haarmonsters waargeneem, hoofsaaklik as gevolg van genetiese drywing en bottelnekke wat voorkom as gevolg van die haarfollikel se semiklonale aard (Budowle et al., 2003 Buffoli et al., 2013 Paus, 1998 Rogers, 2004) . Dus, as 'n bewys-haarmonster een van die twee heteroplasmiese afstammelinge bevat wat in 'n verwysingsmonster waargeneem word, of omgekeerd, dan kan die interpretasie van uitsluiting verkeerd wees. In hierdie geval kan dit nodig wees om bykomende hare te tik om die probleem op te los (Budowle et al., 2003).

Soos voorheen uitgewys is, word aanvaar dat die mitochondriale genoom moederlik oorgeërf word. Al bevat die sperm 'n paar mitochondria in die nek en in die stertgebied, word die manlike mitochondriale genoom vernietig óf tydens óf kort ná die bevrugting. Meer presies, spermmitochondria verdwyn in die vroeë embriogenese, hetsy deur selektiewe vernietiging, inaktivering of verdunning (Cummins, Wakayama & Yanagimachi, 1997 Shitara et al., 2000 Shitara et al., 1998 Wallace, 2007). Nietemin, in die laaste jare is sommige gevalle van biouerlike mtDNA-oorerwing aangemeld. In die mees onlangse geval beskryf Luo en medewerkers biouerlike mtDNA-oorerwing, hetsy direk of indirek, in 17 lede van drie multigenerasionele gesinne, met resultate wat deur twee onafhanklike laboratoriums bevestig is (Luo et al., 2018). Benewens hierdie verslag by mense, is daar ook 'n paar voorbeelde van vaderlike oorerwing van die mitochondriale genoom by diere (Gyllensten et al., 1991), en om daardie rede en ten spyte van die beperkte bewyse vir vaderlike oorerwing van die mitochondriale genoom by mense, is die hofsaal kan in die versoeking kom om so 'n moontlikheid te gebruik om die gebruik mtDNA bewyse te waardeer.

Mitochondriale DNA-nomenklatuur

As in ag geneem word dat die lys van meer as 600 basisse om die resultate van 'n nuwe HV1- en HV2-volgorde te beskryf onprakties sou wees, is 'n alternatiewe benadering ontwikkel wat in wese die verskille met betrekking tot die verwysingsvolgorde rCRS identifiseer en rapporteer (Anderson et al., 1981). .

Alhoewel die proses om mtDNA-volgordes te benoem eenvoudig en voor die hand liggend lyk, is dit noodsaaklik om die nomenklature behoorlik te oorweeg, aangesien komplikasies kan ontstaan. Die meeste onduidelikhede in die belyning/nomenklatuur ontstaan ​​as gevolg van invoegings en/of skrappings (indels). Om onduidelikhede te vermy, haplotipe-identifikasie en hul toewysing aan bestaande haplogroepe of nuwe haplogroepe te fasiliteer, is filogeneties-gebaseerde nomenklatuurriglyne voorgestel. Die filogenetiese benadering bied 'n evolusionêr-gebaseerde siening van globale mtDNA-diversiteit wat wetenskaplik gesond is omdat alle mtDNA-afstammelinge van 'n gemeenskaplike moederlike voorouer afkomstig is. Die filogenetiese notasie van mtDNA-haplogroepe kan gebaseer word op maksimum parsimony of maksimum waarskynlikheid analise van mutasies teenwoordig in volgordes van die kontrole streek of in mitogenome (vir omvattende oorsigte in filogenetiese rekonstruksie metodes sien (Bianchi & Liò, 2007 De Bruyn, Martin & Lefeuvre, 2014). Die mees omvattende bewaarplek van mtDNA-genome is Phylotree (http://www.phylotree.org) 'n webwerf wat ook die verwysingsfilogenetiese boom verskaf wat die wêreldwye menslike mitochondriale DNA-variasie beskryf (Van Oven & Kayser, 2008). Die filogenetiese boom wat in Phylotree gewys word, word gereeld opgedateer met nuwe haplogroepe soos gevind deur maksimum parsimony-analise van nuwe mtDNA-haplotipes met behulp van die mtPhyl-sagteware (https://sites.google.com/site/mtphyl/home) (Van Oven, 2015). waarskynlikheidsbenadering vir mtDNA-haplogroepklassifikasie genaamd EMMA is onlangs deur Röck en medewerkers beskryf (Röck et al., 2013).

Variante langs lang C-streke is onderhewig aan volgorde-spesifieke konvensies. Die lang C-streke van HVS-I en HVS-II moet altyd met 16 189C en 310C onderskeidelik gepunt word. Lengtevariasie van die kort A-kanaal wat 16 184 voorafgaan, moet aangeteken word met voorkeur aan transversies, tensy die filogenie anders voorstel.Wat skrappings betref, word dit aangeteken deur die nommer van die basis(s) wat ontbreek, met betrekking tot die rCRS, gevolg deur DEL of del of (-) (byvoorbeeld 249 DEL of 249 del of 249-). Wanneer enige van die vier basisse waargeneem word, moet N-notasie gebruik word. Indels moet 3′ geplaas word met betrekking tot die ligte string tensy die filogenie anders voorstel. Byvoorbeeld, as die basisse anderkant die posisie 309 met een basis uit die register was as gevolg van die invoeging van 'n C, word die mutasie as 309.1C aangewys. Twee C-invoegings word as 309.1C en 309.2C aangewys. Belangrike gereedskap om te help met die notasie van mtDNA-volgordes is beskikbaar by http://empop.org/. Hierdie notasies word gebruik vir die stoor van haplotipes in die EMPOP-databasis en is ook aangeneem deur die Wetenskaplike Werkgroep oor DNA-metodes (SWGDAM) in die Verenigde State (Parson et al., 2014).

Oor die algemeen word die groot meerderheid individue uit Afrika-bevolkings, en veral uit Afrika-bevolkings suid van die Sahara, gekategoriseer in een van die hoofhaplogroep-afstammelinge wat van makro-haplogroep L afgewyk het: L0, L1, L2, L3, L4, L5 en L6 (Allard et al., 2005 Bandelt et al., 2001 Behar et al., 2008 Chen et al., 2000 Gonder et al., 2007 Pakendorf & Stoneking, 2005 Rosa et al., 2004 Van Oven & Kayser, 2008). Aan die ander kant word meer as 90% van die individue van die Europese en Amerikaanse Kaukasiese bevolkings in 10 hoofhaplogroep-afstammelinge gekategoriseer: H, I, J, K, M, T, U, V, W en X (Allard et al. ., 2002 Behar et al., 2008 Budowle et al., 2003 Pakendorf & Stoneking, 2005 Torroni et al., 1996). Wat Afro-Amerikaanse bevolkings betref, is die mees algemeen waargenome haplogroepe L2a, L1c, L1b en L3b (Allard et al., 2005). Die hoofhaplogroepe wat in individue van Asiatiese bevolkings aangetref word, is haplogroepe M en N (Allard et al., 2004 Kivisild, 2015).

Mitochondriale DNA-tikriglyne

In 2014 het die DNS-kommissie van die Internasionale Vereniging van Forensiese Genetika (ISFG) opgedateerde riglyne en aanbevelings oor mitochondriale DNS-tipering gepubliseer. Hierdie riglyne het verwys na goeie laboratoriumpraktyke, geteikende streek, amplifikasie- en volgordebepalingreekse, verwysingsvolgorde, belyning en notasie, heteroplasmie, haplogroepering van mtDNA-volgordes, en databasisse en databasissoektogte. In Tabel 1 bied ons die 16 aanbevelings van ISFG aan. Oor die algemeen is dit die hoofriglyne rakende die toepassing van mtDNA-polimorfismes in menslike identifikasie, wat gereeld hersien en gepubliseer word deur die International Society of Forensic Genetics (Bär et al., 2000 Parson et al., 2014 Prinz et al., 2007 Tully. et al., 2001).

Aanspreek Aanbeveling Verklaring
Algemene aanbevelings/ goeie laboratoriumpraktyke Aanbeveling #1 Goeie laboratoriumpraktyke en spesifieke protokolle vir werk met mtDNS moet in ooreenstemming met vorige riglyne gevolg word
Aanbeveling #2 Negatiewe en positiewe kontroles sowel as ekstraksie-reagens-blankes moet deur die hele laboratoriumproses gedra word
Aanbeveling #3 Gerapporteerde konsensus-reekse moet gebaseer wees op oortollige volgorde-inligting, deur voorwaartse en omgekeerde volgorde-reaksies te gebruik wanneer dit ook al prakties is
Aanbeveling #4 Handmatige transkripsie van data moet vermy word en onafhanklike bevestiging van konsensus haplotipes deur twee wetenskaplikes moet uitgevoer word
Aanbeveling #5 Laboratoria wat mtDNA-tik in forensiese gevallewerk gebruik, sal gereeld deelneem aan geskikte vaardigheidstoetsprogramme
Geteikende streek, versterking en volgordebepalingreekse Aanbeveling #6 In bevolkingsgenetiese studies vir forensiese databasisdoeleindes, moet die hele mitochondriale DNS-beheergebied in volgorde geplaas word.
Verwysingsvolgorde Aanbeveling #7 MtDNA-volgordes moet in lyn gebring en gerapporteer word relatief tot die hersiene Cambridge-verwysingsvolgorde (rCRS, NC001807), en moet die interpretasiereeks insluit (uitgesluit primervolgorde-inligting)
Belyning en notasie Aanbeveling #8 IUPAC-konvensies wat hoofletters gebruik, sal gebruik word om verskille tussen die rCRS en (punt heteroplasmiese) mengsels te beskryf. Kleinletters moet gebruik word om mengsels tussen geskrapte en nie-geskrapte (ingevoeg en nie-ingevoegde) basisse aan te dui. N-benamings moet slegs gebruik word wanneer al vier basisse op 'n enkele posisie waargeneem word (of as geen basisoproep by 'n gegewe posisie gemaak kan word nie). Vir die voorstelling van skrappings sal “DEL”, “del” of “S” gebruik word
Aanbeveling #9 Die belyning en notasie van mtDNA-volgordes moet uitgevoer word in ooreenstemming met die mitochondriale filogenie (gevestigde patrone van mutasies). Gereedskap om te help met die notasie van mtDNA-volgordes is beskikbaar by http://empop.org/
Heteroplasmie Aanbeveling #10 In forensiese gevallewerk moet laboratoriums hul eie interpretasie- en rapporteringsriglyne vir waargenome lengte- en puntheteroplasmie daarstel. Die evaluering van heteroplasmie hang af van die beperkings van die tegnologie en die kwaliteit van die volgordebepalingsreaksies sowel as die ervaring van die laboratorium. Verskille in beide PHP en LHP vorm nie bewyse vir die uitsluiting van twee andersins identiese haplotipes as afkomstig van dieselfde bron of dieselfde moederlike afkoms nie
Aanbeveling #11 Vir populasie databasis monsters, moet lengte heteroplasmie in homopolimeriese volgorde strekke geïnterpreteer word deur die dominante variant te noem, wat bepaal kan word deur die posisie te identifiseer met die hoogste voorstelling van 'n nie-herhalende piek stroomaf van die geaffekteerde strek
Haplogroepering van mtDNA-volgordes Aanbeveling #12 MtDNA-bevolkingsdata moet onderwerp word aan analitiese sagteware-instrumente wat filogenetiese kontrole vir datakwaliteitbeheer vergemaklik. 'n Omvattende reeks QC-instrumente word deur EMPOP verskaf
Databasisse en databasissoektogte Aanbeveling #13 Die hele databasis van beskikbare rye moet deursoek word met betrekking tot die volgordebepaling (interpretasie) reeks om bevooroordeelde navraagresultate te vermy
Aanbeveling #14 Laboratoria moet die keuse van databasis(te) en statistiese benadering wat in verslagdoening gebruik word, kan regverdig
Aanbeveling #15 Laboratoria moet statistiese riglyne vir gebruik in die rapportering van 'n mtDNA-passing tussen twee monsters daarstel
Aanbeveling #16 Hoogs veranderlike posisies soos lengtevariante in homopolimeriese strekke moet buite rekening gelaat word by soektogte vir die bepaling van frekwensieskattings. Heteroplasmiese oproepe moet navraag gedoen word op 'n manier wat nie enige van die heteroplasmiese variante uitsluit nie

Mitochondriale DNA-volgordebepalingsmetodologieë

In 1977 het Sanger die eerste DNS-volgordebepalingstegnologie aangebied (Sanger, Nicklen & Coulson, 1977), ook genoem die kettingbeëindigingsmetode en nou bekend as eerstegenerasie-volgordebepaling. Die inkorporering van ddNTP's in nuut gesintetiseerde DNA-stringe lei tot beëindiging van die verlengingsproses en ooreenstemmende kennis oor die spesifieke nukleotied teenwoordig by die volgorde by elke posisie. Sanger-volgordebepalingsmetode kan leeswerk van 25 tot 1200 nukleotiede produseer, wat die lees van 'n maksimum van 96 kb nukleotiede in 2 uur moontlik maak.

Sedert 2005 is nuwe volgordebepalingsmetodes, ook bekend as volgende generasie volgordebepaling (NGS) metodes, ontwikkel (Bruijns, Tiggelaar & Gardeniers, 2018). Volgordebepaling deur sintesemetodes soos Roches se 454 Pyrosequencing, en Illuminas se HiSeq, laat volgordebepaling van tot 80 miljoen basispare in 2 uur of tot 6 miljard basispare in 1–2 weke toe (Mascher et al., 2013 Pukk et al. , 2015). Volgordebepaling deur hibridisasie en afbinding, soos die ABI SOLiD 3plus-platform, lewer 60 gigabasisse bruikbare DNA-data per lopie. Met hierdie massiewe parallelle volgordebepaling (MPS) tegnologieë, kan opeenvolgende DNA-fragmente wissel van 35-75 nukleotiede soos in die SOLiD-tegnologie (Bruijns, Tiggelaar & Gardeniers, 2018 Ondov et al., 2010 Shendure et al., 2005), tot 100– 1 000 nukleotiede soos in 454-pyrovolgordebepaling (Bruijns, Tiggelaar & Gardeniers, 2018 Dames et al., 2010). Ion Torrent se Personal Genome Machine™ (PGM) gebruik 'n opsporingsmetodologie wat gebaseer is op pH-verandering by toevoeging van 'n nukleotied by 'n volgorde (Rothberg et al., 2011). Wanneer dit gebeur word protone vrygestel wat 'n elektriese sein genereer wat eweredig is aan die hoeveelheid protone wat vrygestel word. Data-insameling word uitgevoer deur 'n komplementêre metaaloksied-halfgeleier (CMOS) sensor-skikkingskyfie met die sensoroppervlak aan die onderkant van die putplaat, en hierdie skyfies kan miljoene tot biljoene gelyktydige volgordebepalingsreaksies meet (Liu et al., 2014) ). Ten slotte, MinION (Oxford Nanopore Technologies), 'n draagbare intydse volgordebepalingstoestel, laat ultra-lang leeslengtes (honderde kb) toe, alhoewel met laer akkuraatheid (Oikonomopoulos et al., 2016).

Die NGS-tegnologieë is vinnig toegepas in forensiese ondersoeke (Bruijns, Tiggelaar & Gardeniers, 2018). Byvoorbeeld, Ion Torrent se PGM-stelsel is gebruik vir die volgordebepaling van volledige mitogenome (Parson et al., 2013) en om heteroplasmie (Magalhães et al., 2015) in die forensiese konteks te bestudeer. Alhoewel PGM sensitief en akkuraat geblyk het te wees om mengsel en heteroplasmie op te spoor en te kwantifiseer, was daar 'n paar probleme in die dekking van die mtDNA-genoom met sommige streke wat uiterste string-vooroordeel vertoon, en die aanbieding van vals positiewes meestal gegenereer deur belyningsprobleme in die analise-algoritmes. Meer onlangs is Ion S5 System (Thermo Fisher Scientific) en MiSeq FGx Desktop Sequencer (Illumina) gebruik om die Precision ID mtDNA Whole Genome Panel te evalueer (Woerner et al., 2018). Beide volgordebepalingstelsels het konsekwente beraming van mtDNA-haplotipes verskaf. Baie ander studies oor die gebruik van NGS-tegnologieë vir forensiese genetika en mtDNA-analise is gepubliseer (Chaitanya et al., 2015 Churchill et al., 2018 Hollard et al., 2017 Just, Irwin & Parson, 2015 Just et al., 2014a. Just et al., 2014b Lopopolo et al., 2016 Ma et al., 2018 Marshall et al., 2017 Ovchinnikov et al., 2016 Park et al., 2017 Templeton et al., 2013 Young et al., 2017). Verdere bekragtigingstudies en gespesialiseerde sagteware-funksionaliteit wat aangepas is vir forensiese praktyk moet egter geproduseer word om die inkorporering van NGS-verwerking in standaardgevalle-toepassings te fasiliteer (Amorim & Pinto, 2018 Peck et al., 2016). Intussen, en volgens huidige internasionale riglyne (Parson et al., 2014 Prinz et al., 2007), bly Sanger-volgordebepaling steeds 'n voldoende metode vir mtDNA-analise vir forensiese menslike identifikasie, en word dit in die meeste gevallewerklaboratoriums wêreldwyd gebruik. (Ballard, 2016). Sommige forensiese laboratoriums voer Sanger-volgordebepaling vir HVI- en HVII-fragmente uit, terwyl ander die studie reeds na die HVIII-fragment uitgebrei het en die afgelope paar jaar stel die meeste van die forensiese laboratoriums die versterking van die hele beheerstreek as roetine-metodologie bekend (Chaitanya et al. ., 2016 Poletto et al., 2019 Turchi et al., 2016 Yasmin et al., 2017). In 'n poging om die krag van mtDNA in menslike identifikasie te verbeter, is sommige studies oor die afgelope dekade gefokus op die uitbreiding van die ontledings na die hele mtDNA-genoom (Duan et al., 2019 Strobl et al., 2018 Woerner et al., 2018 ). Dit moet nietemin beklemtoon word dat hoewel die inligting van die hele mtDNA-genoom kan bydra om die haplogroep wat verkry is met die studie van HVI-, HVII- en HVII-fragmente of die hele kontrolegebied te verfyn, dit nie veronderstel is om die vorige resultate na 'n ander te verander nie. haplogroep van 'n heeltemal ander geografiese afkoms.

Mitochondriale DNA-populasiedata en databasisse

Wanneer twee mtDNS-volgordes, een van 'n bewysmonster en 'n ander van 'n verwysingsmonster, nie uitgesluit kan word as afkomstig van presies dieselfde bron nie, is dit nodig om inligting oor die rariteit van die mtDNA-profiel oor te dra. Die huidige praktyk is om te tel hoeveel keer 'n spesifieke volgorde binne 'n populasiedatabasis(e) waargeneem word (Budowle et al., 1999). Oor die algemeen bevat die bevolkingsdatabasisse wat in forensiese ondersoeke gebruik word verskeie geriefssteekproewe, wat die belangrikste bevolkingsgroepe van die potensiële bydraers in terme van bewyse verteenwoordig.

Die belangrikste mtDNA haplotipes databasis is die EDNAP Mitochondrial DNA Population Database (EMPOP, http://www.empop.org) (Parson & Dür, 2007). In sy vroeë stadiums is EMPOP ontwerp en in die vooruitsig gestel om as 'n verwysingspopulasiedatabasis te dien, spesifiek om gebruik te word in die evaluering van die mtDNA-bewyse regoor die wêreld, met die doel om die hoogste gehalte mtDNA-data te verskaf. Die argitektuur van hierdie aanlyn databasis en sy analise-instrumente het oor die laaste paar jaar ontwikkel, al is die hoofklem van die EMPOP-databasis steeds mtDNA-datakwaliteit. Daarom, en as 'n direkte gevolg, dien EMPOP nie net as 'n verwysingspopulasiedatabasis nie, maar ook as 'n gehaltebeheerinstrument vir wetenskaplikes in forensiese genetika, sowel as in ander dissiplines. Ten slotte, en al is daar 'n aansienlike aantal verwysingspopulasiedatabasisse van hoë gehalte vir forensiese vergelykings, is EMPOP die mees omvattende hulpbron, veral vanuit die oogpunt van die bevolkings wat in so 'n databasis verteenwoordig word (Parson et al., 2014).

EMPOP gebruik SAM, 'n string-gebaseerde soekalgoritme wat navraag- en databasisreekse omskakel in belyningsvrye nukleotiedstringe en dus waarborg dat 'n haplotipe in 'n databasisnavraag gevind word, ongeag die belyning daarvan. SAM-E, 'n bygewerkte weergawe van SAM wat blok InDels as filogenetiese gebeurtenisse beskou, word tans gebruik. By EMPOP verteenwoordig die hulpmiddel-haplogroepblaaier al die gevestigde Phylotree-haplogroepe in gerieflike soekbare formaat en verskaf die aantal EMPOP-volgordes wat aan die onderskeie haplogroepe toegeken is deur mitochondriale DNA-haplogroepe te skat deur die maksimum waarskynlikheidsbenadering EMMA te gebruik (Röck et al., 2013). Vir veelvuldige moontlike haplogroepe word mees onlangse gemeenskaplike voorouer (MRCA) haplogroepe verskaf.

Soos voorheen genoem, verskaf PhyloTree 'n opgedateerde omvattende filogenie van globale menslike mtDNA-variasie, gebaseer op beide kodering en beheerstreekmutasies (Van Oven & Kayser, 2008). Die volledige mtDNA filogenetiese boom sluit voorheen gepubliseerde sowel as nuut geïdentifiseerde haplogroepe in, word voortdurend en gereeld bygewerk, en is aanlyn beskikbaar by http://www.phylotree.org. By EMPOP word die geografiese haplogroeppatrone via kaarte verskaf om hul geografiese verspreiding te visualiseer en beter te verstaan ​​(Fig. 2).

Figuur 2: Voorstelling van die geografiese oorsprong van die hoof mtDNA haplogroepe, gebaseer op Lott et al. (2014).

Nog 'n belangrike menslike mtDNA-databasis is Mitomap (Ruiz-Pesini et al., 2007). In 1996 het hierdie databasis ontwikkel tot 'n aanlyn databasis (http://www.mitomap.org) wat gepubliseerde menslike mtDNA-variasie saam met geografiese en siekte-spesifieke variante bevat. Tans, Mitomap word met die hand saamgestel, gereeld opgedateer en 'n funksioneel ryk hulpbron, wat menslike mtDNA-data van hoë gehalte aanbied vir klinici, ondersoekers en genetici (Ruiz-Pesini et al., 2007). Mitomap het drie hoofkategorieë vir gebruik. Dit bevat 'n paar agtergrondinligting rakende die menslike mitochondriale DNA, soos die algemene voorstelling van mtDNA, haplogroepe en hul frekwensies en illustrasies van mtDNA, onder andere. Verder kan gebruikers ook inligting oor ander mtDNA-spesifieke databasisse, gereedskap en nuttige hulpbronne vind.

Mitomap stoor die geannoteerde lys van die mtDNA-variante van beide gesonde individue en pasiënte. Die frekwensies van die variante word bereken vanaf menslike mitogenome wat uit die GenBank. Daarom kan gebruikers inligting oor onder meer die lokusse, die nukleotiedverandering, die kodonposisie en die nommer ophaal en die belangrikste data in verskillende lêerformate aflaai.

Mitomap bevat die Mitomeester analise-instrument, wat tans die toepassingsprogrammeringskoppelvlak daarvoor verskaf. Die hooffunksie van hierdie instrument is om die identifikasie van polimorfiese posisies, die berekening van variantstatistieke en die toewysing van haplogroepe aan volledige of gedeeltelike mitogenome moontlik te maak. Sodanige navraag kan uitgevoer word deur herhaling na mtDNA-volgordes, na GenBank-identifiseerders of na enkelnukleotiedvariante (Brandon et al., 2009).

Vanuit 'n ander perspektief kan etiese en wetlike probleme ontstaan ​​in die implementering van mtDNA-databasisse. Die insiggewende potensiaal wat die ontleding van mtDNA behels, kan privaatheidsvrae genereer (Guillen et al., 2000 Wallace et al., 2014). Mitochondriale siektes raak tussen 1 uit 4 000 en 1 uit 5 000 mense. In die meeste mense is primêre mitochondriale siekte 'n genetiese toestand wat oorgeërf kan word. Inligting oor die mitochondriale genoomsamestelling kan dus die identifikasie van die huidige of toekomstige gesondheidstoestand van 'n individu moontlik maak. Om hierdie rede moet die ontleding van mtDNA slegs op nie-koderende streke uitgevoer word, wat nie met enige soort siekte of fenotipiese inligting geassosieer is nie.

Mitochondriale DNA in Forensiese Menslike Identifikasie

In die konteks van forensiese analise word beide mtDNS-volgordes van 'n verwysingsmonster en 'n bewysmonster(s) vergelyk. Wanneer die rye ondubbelsinnig verskil, is die gevolgtrekking dat hulle uitgesluit kan word as afkomstig van dieselfde bron. Alhoewel dit nie in enige navorsingsartikel of riglynteks vermeld word nie, is forensiese roetine-laboratoriums geneig om as 'n uitsluitingscenario te aanvaar wanneer meer nukleotiedverskille tussen die twee reekse bestaan. As die mtDNA-volgordes identies is, kan die monsters nie uitgesluit word nie aangesien hulle dieselfde oorsprong moet hê of van dieselfde moederlike afkoms moet afkomstig wees. Net so kan monsters nie uitgesluit word wanneer heteroplasmie op dieselfde nukleotiedposisies in beide monsters waargeneem word nie. Wanneer een monster heteroplasmies is en die ander is homoplasmies, maar albei deel ten minste een mtDNA-spesie, kan die monsters nie uitgesluit word nie, aangesien hulle dieselfde oorsprong kan hê. Verskeie skrywers het voorgestel dat monsters met mtDNA met een-basis verskil verder geëvalueer moet word, hoofsaaklik met betrekking tot hul mutasietempo (Alonso et al., 2002 Bär et al., 2000 Holland & Parsons, 1999 Parson et al., 2014 Tully et al. al., 2001).

In hierdie afdeling bied ons 'n paar geselekteerde gepubliseerde gevalle van menslike identifikasie met mtDNA aan. Tabel 2 som die geselekteerde gepubliseerde gevalle op. Stoneking et al. (1991) het die eerste verslag van suksesvolle toepassing van die mtDNS-tipering op 'n geval aangebied wat die individuele identifikasie van skeletale oorblyfsels behels het. Dit was die geval van 'n 3-jarige kind wat in Oktober van 1984 uit haar ouerhuis verdwyn het. In Maart 1986 is die skeletoorblyfsels van 'n mensekind in die woestyn gevind, 2 myl weg van die ouerhuis.Deur gebruik te maak van hibridisasie met 23 volgorde-spesifieke oligonukleotiedprobes (SSO) wat nege streke van HV1 en HV2 op die kontrolegebied gerig het, het hulle gevind dat die skeletmonster en die moeder dieselfde mtDNA-tipes gedeel het, wat bevestig dat daardie skeletale oorblyfsels van die vermiste kind was. Boonop het hulle verwag dat die mtDNA-tipering waardevol sou wees nie net om biologiese oorblyfsels aan vermiste individue te koppel nie, maar ook in die ontleding van materiaal in gevalle van seksuele aanranding.

In Julie 1990 is die liggaam van 'n wyfie, in 'n redelik gevorderde toestand van ontbinding, in 'n oop veld ontdek. Ten spyte daarvan dat dit onmoontlik was om die oorskot te identifiseer deur die individu se klere en vingerafdrukke te ontleed, was haar gebit in ooreenstemming met ou tandheelkundige rekords van 'n vermiste persoon uit dieselfde streek. Sommige fragmente van die hakskeenbeen en fibula, plus monsters van die hare en vel, is vir die DNS-analise verskaf, sowel as 'n bloedmonster van 'n vermeende suster van die oorledene. Sullivan, Hopgood & Gill (1992) het die identifikasie van die hoogs ontbinde oorblyfsels van die lyk gepoog, deur 2 hiperveranderlike segmente binne HV1 en HV2 in die mtDNA te versterk en direk in volgorde te plaas. Geen statistiese waarde is aan die getuienis gegee nie, aangesien geen databasis van die Britse bevolkingsreekse op daardie tydstip beskikbaar was nie. Tog is daar geen verskille tussen beide volgordes gevind nie, die bloed van die vermoedelike suster en die been van die lyk, wat aandui dat hulle susters was.

Verwysing/Jaar Het monsters bestudeer mtDNA bestudeer streke Gebruikte metodologieë Verwysingsmonsters Resultate
Stoneking M, Hedgecock D, Higuchi RG, Vigilant L, Erlich HA. Bevolkingsvariasie van menslike mtDNA-kontrolestreeksekwense wat deur ensiematiese amplifikasie en volgordespesifieke oligonukleotiedprobes opgespoor is. Am J Hum Genet. 199148(2):370–82. Skeletoorblyfsels van 'n mensekind, gevind in 1986 HVI, HVII PCR vir amplifikasie
Hibridisering met oligonukleotiedprobes vir volgordebepaling
Ouers van 'n 3-jarige kind het in 1984 van die huis verdwyn Identiese mtDNS-volgorde in skeletale oorblyfsels en monster van die 3-jarige kindermoeder
Positiewe ID
Sullivan KM, Hopgood R, Gill P. Identifikasie van menslike oorblyfsels deur amplifikasie en outomatiese volgordebepaling van mitochondriale DNA. Int J Legal Med. 1992105(2):83–6. Liggaam van 'n wyfie, in 'n gevorderde toestand van ontbinding wat in 1990 ontdek is HVI, HVII PCR vir amplifikasie
Sanger-volgordebepaling
Bloedmonster van 'n suster van 'n oorlede wyfie in dieselfde streek Geen verskille is tussen die lyk en bloed van die vermeende suster waargeneem nie
Positiewe ID
Gill P, Ivanov PL, Kimpton C, Piercy R, Benson N, Tully G, et al. Identifikasie van die oorblyfsels van die Romanov-familie deur DNA-analise. Nat Genet. 19946(2):130–5. Nege geraamtes gevind in 'n graf in Ekaterinburg, Rusland, 1991 HVI, HVII PCR vir amplifikasie
Sanger-volgordebepaling
Bloedmonster van Gt. Gt. Kleinseun van Louise van Hesse-Cassel en van Gt. Gt. Gt. Kleindogter van Louise van Hesse-Cassel Presiese volgorde tussen vermeende tsarina Alexandra en vermeende drie kinders.
Presiese mtDNA-resultate tussen vermeende tsaar Nicholas II en twee lewende moederlike familielede van die tsaar
Ivanov PL, Wadhams MJ, Roby RK, Holland MM WV & amp PT. Mitochondriale DNA-volgorde heteroplasmie in die Groothertog van Rusland Georgij Romanov stel die egtheid van die oorblyfsels van tsaar Nicholas II vas. Nat Genet. 1996(12):417–20. Skelet van vermeende tsaar Nicholas II HVI, HVII PCR vir amplifikasie
Sanger-volgordebepaling
Geraamte van groothertog van Rusland Georgij Romanov (tsaar se broer)
Bloedmonster van gravin Xenia Cheremeteff-Sfiri (tsaar se familielid van moederskant)
Vasstelling van die egtheid van die oorblyfsels van tsaar Nicholas II
Deng YJ, Li YZ, Yu XG, Li L, Wu DY, Zhou J, et al. Voorlopige DNS-identifikasie vir die tsoenami-slagoffers in Thailand. Genomika, Proteomika Bioinforma. 20053(3):143–57. 258 tandmonsters van mense wat vermoor is tydens die 2004 Suidoos-Asië Thailand Tsunami HVI, HVII PCR vir amplifikasie
Sanger-volgordebepaling
200 familielede van die tsoenami-slagoffers 200 tsoenami-slagoffers is geïdentifiseer, insluitend Thaise burgers en buitelandse toeriste van verskeie nasies
Ríos L, García-Rubio A, Martínez B, Alonso A, Puente J. Identifikasieproses in massagrafte uit die Spaanse Burgeroorlog II. Forensiese Wetenskap Int. 2010219(1–3). Skeletoorblyfsels opgegrawe uit 'n massagraf uit die Spaanse Burgeroorlog (1936–1939) HVI, HVII PCR vir amplifikasie
Sanger-volgordebepaling
Suster van die jongste persoon wat vermoedelik in die graf begrawe is Ooreenstemming tussen mtDNA-profiele van die biologies jongste skelet en die suster van die jongste persoon wat vermoedelik in die graf begrawe is
Piccinini A, Coco S, Parson W, Cattaneo C, Gaudio D, Barbazza R, et al. Eerste Wêreldoorlog Italiaanse en Oostenrykse soldaat-identifikasieprojek: DNS-resultate van die eerste saak. Forensiese Wetenskap Int Genet. 20104(5):329–33. Oorblyfsels van vermiste soldate word soms tydens opgrawings gevind HVI, HVII PCR vir amplifikasie
Sanger-volgordebepaling
Nageslag van die Italiaanse soldaat Libero Zugni Tauro Beide mtDNA en Y-STR data het duidelike uitsluiting scenario's getoon
tussen die menslike oorskot en die verwysingsmonsters
King TE, Fortes GG, Balaresque P, Thomas MG, Balding D, Delser PM, et al. Identifikasie van die oorblyfsels van koning Richard III. Nat Commun. 20145:1–8. Skelet opgegrawe by die vermoedelike terrein van die Grey Friars-klooster in Leicester, 2012 Hele mitochondriale genoom PCR vir amplifikasie
Massiewe parallelle opeenvolging
Speekselmonsters van die moderne familielede van Richard III Positiewe mtDNA-ooreenkoms tussen die enigste bekende vroulike lyn van Richard III en bestudeerde moderne familielede van Richard III
Ossowski A, Diepenbroek M, Kupiec T, Bykowska-Witowska M, Zielińska G, Dembińska T, et al. Genetiese identifikasie van Slagoffers van Kommunistiese Misdade (1944–1956) Gebaseer op die ontleding van een van baie massagrafte wat op die Powazki Militêre Begraafplaas in Warskou, Pole, ontdek is. J Forensiese Wetenskap. 201661(6):1450–5. Oorblyfsels van agt mense wat in een van vele massagrafte begrawe is, wat by die begraafplaas Powazzki Military in Warskou, Pole gevind is HVI, HVII PCR vir amplifikasie
Sanger-volgordebepaling
Verwysingsmateriaal is versamel van die naaste lewende familielede van Kommunistiese Misdade se Slagoffers (1944–1956) Positiewe mtDNA-ooreenkoms tussen 6 vermeende slagoffers en 6 lewende familielede
Ambers AD, Churchill JD, King JL, Stoljarova M, Gill-King H, Assidi M, et al. Meer omvattende forensiese genetiese merkerontledings vir akkurate identifikasie van menslike oorskot deur gebruik te maak van massiewe parallelle DNA-volgordebepaling. BMC Genomics. 201617 (Suppl 9). Menslike skeletoorblyfsels met 140-jarige ontdek op 'n historiese terrein in Deadwood, Suid-Dakota, Verenigde State HVI, HVII en tien fragmente van mtDNA-koderende streek PCR vir amplifikasie
Massiewe parallelle opeenvolging
Nie gebruik nie Resultate was in ooreenstemming met vorige antropologiese verslag wat dui op 'n man van Europese afkoms

Miskien is die bekendste geslagstudie wat mtDNA-volgordebepaling gebruik, verwant aan die identifikasie van tsaar Nicholas II se bene. Gill et al. (1994) en Ivanov et al. (1996) het die volgordes van HV1- en HV2-fragmente van die mtDNA wat verkry is vanaf die vermeende bene van die Tsaar vergelyk met dié van Tsaar lewende moederlike familielede, Gravin Xenia Cheremeteff-Sfiri en die Hertog van Fife. Daar is gevind dat die rye baie ooreenstem, wat die hipotese bevestig dat die beenreste van tsaar Nicholas II was.

In 'n duidelike scenario, Deng et al. (2005) het direkte volgordebepaling van die HV1- en HV2-fragmente van die mtDNA-beheerstreek gebruik om Tsunami-slagoffers in Thailand in 2004 te identifiseer. Hierdie tsoenami het byna 5 400 mense in Suid-Thailand doodgemaak, insluitend buitelandse toeriste en plaaslike inwoners. Hulle het daarin geslaag om ten volle insiggewende resultate vir mtDNA-merkers (HV1 en HV2) van 258 tandmonsters te verkry met 'n sukseskoers van 51% (258/507).

Meer onlangs het Ríos, Ovejero & Prieto (2010) direkte volgordebepaling van die HV1- en HV2-fragmente van die mtDNA-beheerstreek gebruik om menslike skeletoorblyfsels te identifiseer wat uit 'n massagraf van die Spaanse Burgeroorlog (1936–1939) opgegrawe is. Daar was 'n ooreenkoms tussen die mtDNA-profiele van die biologies jongste geraamte en die suster van die jongste persoon wat vermoedelik in die graf begrawe is, wat die identifikasie van daardie persoon moontlik maak.

Ook in 2010 het Piccinini et al. (2010) het gepoog om die oorblyfsels van 'n beroemde Italiaanse soldaat uit die Eerste Wêreldoorlog te identifiseer wat in 'n geveg langs die Italiaanse front in 1915 gedood is. Soos vorige studies het hulle die direkte volgorde van die HV1- en HV2-fragmente van die mtDNA-beheerstreek gebruik om enkele mtDNA-haplotipes te definieer. Die beskikbaarheid van die nageslag moederlike afkoms het die mtDNA-analise toegelaat, wat 'n duidelike uitsluitingscenario voorgehou het: die oorblyfsels het nie aan die vermeende oorlogsheld behoort nie.

In 2012 is 'n geraamte opgegrawe op die terrein van die Grey Friars-klooster, in Leicester, wat die laaste bekende rusplek van koning Richard III is (King et al., 2014). Om te bepaal of die oorblyfsels aan koning Richard III behoort, is die HV1-, HV2- en HV3-streke van die mtDNA van die skeletoorblyfsels en van die lewende familielede van koning Richard III opgevolg en vergelyk. Daar was 'n perfekte ooreenstemming tussen die rye wat aandui dat die oorblyfsels aan koning Richard III behoort.

Die kommunistiese tydperk in Pole gedurende 1944–1956 het gelei tot die dood van meer as 50 000 mense, wat in die geheim begrawe is. Een massagraf is gevind by die begraafplaas Powazki Military, in Warskou, Pole. In 2016 het Ossowski en medewerkers (Ossowski et al., 2016) 50 slagoffers geïdentifiseer, spesifiek deur outosomale, Y-STR en direkte volgordebepaling van die HV1- en HV2-fragmente van die mtDNA-beheerstreek te gebruik.

In 2016, een van die eerste studies oor menslike identifikasie met mtDNA met behulp van massiewe parallelle volgordebepaling, Ambers et al. (2016) het 'n protokol voorgestel wat die studie van tien streke van mtDNA insluit vir die identifikasie van historiese menslike oorblyfsels met forensiese genetiese merkers. Hulle het 'n 140 jaar oue menslike skeletoorblyfsel bestudeer wat op 'n historiese terrein in Deadwood, Suid-Dakota, Verenigde State ontdek is. Die oorskot was in 'n ongemerkte graf en daar was geen rekords beskikbaar oor die identiteit van die individu nie. Die mtDNA-profiele van die ongeïdentifiseerde skeletale oorblyfsels wat met hul metode verkry is, was in ooreenstemming met H1-haplogroep. Hierdie haplogroep is die algemeenste in Wes-Europa. Die voorgeslag-insiggewende kern-SNP's wat ook in hierdie geval bestudeer is, het 'n Europese agtergrond aangedui. Hierdie genetiese resultate stem ooreen met die bevindinge van vorige antropologiese verslag wat bepaal het dat die Deadwood ongeïdentifiseerde skeletoorblyfsels aan 'n mannetjie van Europese afkoms behoort.

In 2017 is die slagoffers se oorskot van die World Trade Center-terreurwet, wat in September 11 van 2001 plaasgevind het, steeds geïdentifiseer deur onder meer die mtDNA-volgordebepalingstegnologie te gebruik met protokolle en riglyne soos aanbeveel deur die International Society for Forensic Genetika (Goodwin, 2017).


Resultate en bespreking

Bis-SNP werkvloei

Die twee primêre stappe in die Bis-SNP-werkvloei word in Figuur 2a uiteengesit en sluit herkalibrasie van basiskwaliteit en plaaslike herbelyning gevolg deur SNP-oproepe in. Bis-SNP aanvaar standaard-belyningslêers (.bam-formaat), wat gegenereer kan word deur gewilde Bisulfite-seq karteringprogramme soos MAQ, Bismark, BSMAP, PASH of Novoalign (hersien in [10]). Dit laat die gebruiker toe om te besluit watter karteringkriteria die belangrikste is vir hul spesifieke toepassing. Dit maak Bis-SNP ook versoenbaar met gespesialiseerde karteerders soos RRBSMAP [33] en enige ander program wat (.bam) lêers kan uitvoer.

Bis-SNP werkvloei. (a) Bis-SNP aanvaar .bam-lêers, vervaardig deur 'n genoomkarteringinstrument (BSMAP, MAQ, Novoalign, Bismark, ensovoorts). Die plaaslike herbelyning en basiskwaliteit herkalibrasie stappe lei tot 'n nuwe BAM met die herkalibreerde basis kwaliteit tellings. Laastens voer Bis-SNP SNP-oproepe uit en lewer beide metileringsvlakke en SNP-oproepe uit. (b) Die SNP-oproepstap word op elke genomiese posisie onafhanklik uitgevoer. Verskille tussen die verwysingsgenoom en die monstergenoom kan een van 10 moontlike alleelpare of genotipe (G, slegs 4 wat hier gewys word). Frekwensies van alle moontlike substitusies in die populasie word uit die dbSNP-databasis geneem en as voorgestel π(G). 'n Waarskynlikheidsmodel wat vorige waarskynlikhede vir metileringsvlak en bisulfiet-omskakelingsdoeltreffendheid insluit, word gebruik om die waarskynlikheid te bereken om die werklike bisulfiet-leesdata waar te neem (D) deur elk van die 10 genotipes aan te neem (Pr(G|D)) Laastens gebruik Bayesiese afleiding die populasiefrekwensies van elke SNP om die posterior waarskynlikheid te bereken Pr(D|G).

Die Bis-SNP-model maak staat op die akkuraatheid van basiskwaliteittellings, wat aanvanklik deur die instrumentspesifieke basisoproeper beraam word. Hierdie aanvanklike basistellings verteenwoordig egter nie ware foutwaarskynlikhede nie, wat hoogs afhanklik is van plaaslike volgordekonteks [12]. In die GATK-werkvloei word empiriese wanpassingskoerse vir elke nukleotied by elke volgordesiklus bereken deur basisoproepe met die verwysingsgenoom te vergelyk, en hierdie wanpassingskoerse word gebruik om instrument-gegenereerde waardes te herkalibreer [12]. Ons kan nie hierdie verstekimplementering met bisulfiet-volgorde-data gebruik nie, want ware C>T-volgordebepalingsfoute kan nie geïdentifiseer word wanneer die onderliggende metileringstoestand van elke bisulfiet-omgeskakelde DNA-fragment onbekend is nie. Daarom, in plaas daarvan om Ts by verwysingssitosiene as foute te behandel, behandel ons hulle as 'n 5de basis X, en skat dit as 'n groep apart van T>T, A>T of G>T. Die effek is dat ons die basisoproepkwaliteittellings effektief kan herkalibreer vir almal behalwe die X nukleotied, wat ons vermoë verbeter om SNP's akkuraat te identifiseer. Wat belangrik is, is dat ons in staat is om SNP aanroeping van sitosiene te verbeter deur 'G-string' G's te herkalibreer wat aanvullend tot die sitosien is.

Die gebruiker kan kies tussen verskeie uitvoerlêers. Vir metileringsvlakke kan Bis-SNP 'n standaard UCSC .bed of .wig lêer terugstuur, en 'n aparte uitvoerlêer word gegenereer vir elke sitosienkonteks wat deur die gebruiker op die opdragreël gespesifiseer word. Voorbeeld-sitosienkontekste is CG, CH of CHH (H is die IUPAC-simbool vir A, C of T). Die .wig-uitset bevat die metileringspersentasie vir elke gemetileerde sitosien, terwyl die .bed-formaat ook die aantal C/T-lesings bevat waarop die persentasie gebaseer is, plus die string van elke sitosien relatief tot die verwysingsgenoom. Vir SNP's kan Bis-SNP 'n Variant Calling Format (.vcf)-lêer terugstuur, wat alle SNP-oproepe en waarskynlikheidtellings bykomend tot metileringpersentasies bevat.

Beskrywing van SNP-oproepalgoritme

Die kern van die SNP-oproepalgoritme is gebaseer op die Bayesiaanse afleidingsmodel van GATK [12], en geïmplementeer met behulp van GATK se LocusWalker-klas. Vir elke lokus evalueer Bis-SNP een van tien moontlike diploïede genotipes (G), soos getoon in Figuur 2B ('n diploïede genotipe bestaan ​​uit twee ouerallele, waarna verwys word as A en B). Die vorige waarskynlikheid van elke genotipe, π(G), word bepaal met behulp van bevolkingsdata van dbSNP (insluitend 1000 genome-data) soortgelyk aan SOAPsnp [13] (Sien Materiale en Metodes). In hierdie model roep die waarskynlikheid om alle basis waar te neem by 'n spesifieke lokus, met die aanname van 'n spesifieke diploïede genotipe AB, word uitgedruk as Pr(D|G = AB) en is die produk van die waarneming van die basisoproep by elke individuele lees j (Vergelyking 2 van Materiale en Metodes). Soos hieronder beskryf, Pr(D j|G = AB) word volgens die string van gelees bereken j en verskeie bisulfiet-spesifieke parameters, β,α en γ (Figuur 2b).

In die GATK-nie-bisulfiet SNP-oproepmodel is die waarskynlikheid om 'n basisoproep te waarneem wat verskil van die veronderstelde genotipe G is bloot die basisoproepkwaliteittelling (gedefinieer as die waarskynlikheid van 'n basisoproepfout). In die geval van Bisulfite-seq is dit waar vir A:T genotipes maar nie C:G nie. Vir C:G genotipes hang die waarskynlikheid om 'n T waar te neem af van die string van die lees, die metileringstoestand en die doeltreffendheid van bisulfietomsetting. Lees op die G-string oorkant die sitosien word met die normale GATK-model behandel. Lees op die C-string gebruik 'n alternatiewe model wat C>T-vervangings as óf potensiële foute óf bisulfietomsettings beskou (sien Materiale en Metodes). Die waarskynlikheid om 'n bisulfietomsettingsgebeurtenis waar te neem hang af van beide die onderliggende metileringstoestand en bisulfietomsettingsfoute. Alhoewel nie een hiervan direk waargeneem word nie, word hulle as veranderlikes in die model ingesluit β,α en γ soos beskryf in Vergelyking 5 in die Metodes-afdeling.

Na bisulfietbehandeling word 'n ongemetileerde C wat nie na 'n T omgeskakel word nie, na verwys as 'n onderbekering, terwyl 'n gemetileerde C wat na T omgeskakel word na verwys word as 'n oorbekering. Die onderomskakelingskoers, α, word dikwels beraam met behulp van óf 'n piek in beheer [4] óf die ongemetileerde mitochondriale genoom [6]. Hierdie koers kan handmatig deur die gebruiker ingestel word en het by verstek 'n waarde van 0,25%. Terwyl bisulfiet-ooromskakeling nie betroubaar gemeet kan word met behulp van huidige Bisulfite-seq data nie, sluit ons 'n bykomende parameter in, γ, wat by verstek op 0% gestel is. In die toekoms kan dit beraam word deur volledig gemetileerde kontrole-DNS aan te vul.

Die persentasie gemetileerde lesings by 'n gegewe sitosienposisie kan baie verskil. Aangesien C-lesings en T-lesings meer inligting oor die teenwoordigheid van 'n C>T SNP lewer as T-leses, kan die lokus-spesifieke metileringstempo SNP-oproepe sterk beïnvloed. In soogdiergenome is CpG-metileringsvlakke multimodaal, met verskillende klasse funksionele elemente wat verskillende metileringspatrone het. Ten minste vier verskillende klasse bestaan ​​met gemiddelde metileringskoerse wat wissel van ongeveer 0% tot meer as 80% [4, 24]. Verder is metilering by spesifieke di- of tri-nukleotiedkontekste organisme- en selfs seltipe-spesifiek. Om beter te verstaan ​​hoe metileringsskattings SNP-oproepprestasie kan beïnvloed, het ons verskeie verskillende metodes geïmplementeer om die metileringsfrekwensieparameter te skat β, wat ons volgende beskryf.

Eerstens het ons 'n gebruik naïef skatting vir β waar die waarskynlikheid dat 'n lesing gemetileer of ongemetileer is by enige spesifieke sitosienposisie 0.5 was. Tweedens het ons gebruik konteks-spesifiek ramings wat in 'n twee-ronde prosedure soos volg bepaal is. In die eerste rondte, naïef skattings is gebruik soos hierbo beskryf, en die gevolglike SNP-oproepe is saam met dbSNP gebruik om 'n stel hoë-vertroue nie-SNP homosigotiese sitosiene te kies (waarskynlikheid>99.99%). Hierdie homosigotiese sitosiene is gebruik om gemiddelde metileringsvlakke te skat vir 'n stel sitosienvolgorde-kontekste wat op die Bis-SNP-opdragreël gespesifiseer kan word (by verstek gestel op β CG en β CH). In die derde en laaste skattingsmetode, β is vir elke sitosienlokus individueel beraam deur die aantal C- en T-lesings (c c + t) te gebruik. Die rasionaal hiervoor lokus-spesifiek metode was ons kommer dat genoomwye skattings onvanpaste CpG's kan wees, gegewe die sterk bimodale aard van CpG-metileringsvlakke. Elkeen van hierdie drie β skattingsmetodes is individueel uitgevoer soos hieronder beskryf. Die verstekmetode vir die publieke weergawe van Bis-SNP is lokus-spesifiek skatting.

Evaluering van SNP oproepe by bekende SNPs

Ons het Bis-SNP-oproepakkuraatheid vir elk van die drie verskillende metileringsskattingsmetodes geëvalueer (naïef, konteks-spesifiek, en lokus-spesifiek). Laasgenoemde twee metodes het aansienlik beter gevaar as naïef skatting, so dit is die enigste twee wat hieronder bespreek word. Ons het akkuraatheid geëvalueer met behulp van 'n werklike geheel-genoom Bisulfite-seq-datastel van 'n normale (manlike) menslike kolonslymvliesmonster wat voorheen deur ons laboratorium gepubliseer is [6] (volgorde beskikbaar via toetreding dbGap: phs000385). Alle lesings was 75 bp lank enkel-end, en gegenereer met behulp van die Illumina Genome Analyzer IIx platform. Die volledige datastel het 'n gemiddelde leesdiepte van 32X gehad. Die Bisulfite-seq data is vergelyk met Illumina Human1M-Duo BeadChip SNP skikking data van dieselfde monster.

Die primêre doel van bisulfietvolgordebepaling is die akkurate bepaling van sitosienmetileringsvlakke, daarom het ons eers die vermoë van Bis-SNP ondersoek om homosigotiese sitosiene korrek te identifiseer. As die 'grondwaarheid' het ons 435 120 posisies gebruik wat as homosigotiese sitosiene op die 1 M SNP-skikking geïdentifiseer is, en vals negatiewe en vals positiewe oproepe wat deur Bis-SNP gemaak is, ondersoek (Figuur 3a-c). Oproepe met verskillende strenghede is gegenereer deur die Bis-SNP-telling afsnypunt aan te pas, wat gedefinieer word as die kansverhouding tussen die eerste en tweede mees waarskynlike genotipe (sien Metodes). Die evaluering van die verskillende Bis-SNP-metileringsskattings met en sonder basiskwaliteit herkalibrasie het getoon dat die lokus-spesifieke β skatting plus herkalibrasie het die mees akkurate resultate opgelewer. Deur gebruik te maak van die volledige volgorde datastel en die verstek telling afsnypunt (Figuur 3c, rooi sirkel), was Bis-SNP in staat om 95.22% van die ware sitosiene (414.327 kenmerke) op te spoor met 'n vals positiewe koers van 0.37% (2.461 kenmerke). Ons het ligter opeenvolgingdekking gesimuleer deur lukraak lesings uit die volledige datastel te kies om akkuraatheid te skat by 8× (Figuur 3a) en 16× (Figuur 3b) genomiese dekking. Die leser moet daarop let dat hierdie vals positiewe koerse nie 'n aanduiding is van die genoomwye vals positiewe koerse nie, aangesien die meeste vals positiewes van heterosigotiese SNP's kom wat gereeld op die SNP-skikking voorkom, maar baie selde in die genoom is.

Bis-SNP-foutfrekwensies in die opsporing van SNP's op die Illumina 1 M SNP-skikking. Ontvanger Bedryfskenmerke (ROC-krommes) word getoon vir Bis-SNP-akkuraatheid by die opsporing van SNP's in Bisulfiet-volgorde-data wat van menslike kolonslymvliesweefsel afkomstig is. Die 'ware' genotipes is bepaal deur gebruik te maak van 'n Illumina Duo 1 M Menslike SNP-skikking, en Bis-SNP resultate is slegs by hierdie miljoen genomiese posisies geëvalueer. Alle datastelle was van [6]. Die drie ROC-kurwes aan die bokant (a-c) toon akkuraatheid by posisies wat ooreenstem met 435 120 homosigotiese sitosiene op die 1 M SNP-skikking. Deur ewekansig af te neem van die gemiddelde 32× leesdiepte van die Bisulfite-seq data, is ons in staat om resultate te toon wat ooreenstem met 8× dekking (a), 16× dekking (b). Bis-SNP wat drie verskillende toestande gebruik, word vergelyk met Bismark en die metode wat gebruik word in 'Berman2012' [6], wat albei hul resultate beperk tot verwysingssitosiene. Vir 'Berman2012' het ons die aantal omgekeerde string G-lesings wat nodig is om 'n reeks strenghede te plot, verander. Die drie plotte aan die onderkant (d-f) toon akkuraatheid by die 303 656 posisies wat heterosigoties is volgens die 1 M SNP-skikking. Ter vergelyking toon ons resultate van die k-alleel metode (soortgelyk aan die benadering van [30]), Shoemaker2010 [20] en bisReadMapper [3].

Ter vergelyking het ons die akkuraatheid van homosigotiese sitosienoproepe bepaal met behulp van verskeie gepubliseerde metodes (Figuur 3a-c). Bismark [34] gee metileringsskattings vir alle sitosiene in die verwysingsgenoom terug. Dit is dus nie verbasend dat Bismark swak presteer vir kenmerke op die 1 M SNP-skikking, wat geselekteer is vir hul polimorfisme en verskille van die verwysingsgenoom. Verskeie ander gepubliseerde studies gebruik dieselfde strategie en skat metilering by alle verwysingsitosiene [35, 36]. In ons eie vroeëre werk [6] het ons ook metilering beperk tot verwysingssitosiene. Dit is dus nie verbasend dat toe ons hierdie metode ('Berman2012') op die 1 M SNP-skikkingdatastel toegepas het, dit byna dieselfde vals negatiewe koers as Bismark behaal het. 'Berman2012' het egter posisies uitgefiltreer waar minder as 90% van lees C of T op die C-strand en G op die G-strand was, wat gelei het tot 'n aansienlik laer vals positiewe koers as Bismark, maar nie so laag soos Bis- SNP.

Ons het vervolgens gefokus op die vermoë van Bis-SNP om heterosigotiese SNP's te bepaal, wat gebruik kan word vir beide die verbetering van metileringsoproep akkuraatheid sowel as alleelspesifieke metileringsanalise (sien Figuur 1b). Heterosigotiese SNPs is moeiliker om te identifiseer as homosigotiese SNPs, as gevolg van die ongeveer 1/2 van die leesdekking vir elke alleel. Ons het die haploïede × chromosoom uitgesluit, wat 303 656 outosomale lokusse laat wat as heterosigoties genoem word deur die 1 M SNP-skikking. Soos voorheen, die lokus-spesifieke β metileringsskatting plus herkalibrasie het die beste van alle metodes gelewer. Deur die volledige datastel met die verstek Bis-SNP afsnypunt (Figuur 3c, rooi sirkel) te gebruik, kon Bis-SNP 93.18% van heterosigotiese SNP's (282 944 lokusse) identifiseer met 'n vals positiewe koers van 0.094% (755 lokusse). Van die 303 656 heterosigotiese lokusse wat ondersoek is, was 242 347 (79,81%) C/T heterosigote. C>T is die mees algemene SNP in soogdiere, wat voortspruit uit evolusionêre deaminering van gemetileerde sitosiene. Dit is ook die moeilikste SNP om op te spoor in bisulfiet-behandelde DNA, omdat die C-string-lesings dikwels oninsiggewend is (sien Figuur 1). Soos verwag, het Bis-SNP (en ander metodes) swakker op C/T heterosigotiese SNP's gevaar as ander, as gevolg van C>T-omskakelingsdubbelsinnigheid (Additional File 2).

Ons het Bis-SNP-resultate vergelyk met heterosigotiese SNP's wat genoem word deur twee alternatiewe 'k-allel'-tegnieke te gebruik wat leestelling-afsnypunte gebruik het sonder om basiskwaliteittellings in te sluit. Ons het 'n algemene vorm van die metode wat gebruik word deur [21, 30] geïmplementeer om 'n veranderlike leestelling afsnypunt te gebruik. Hierdie afsnypunt, k, is gedefinieer as die minimum persentasie lees met 'n sekondêre alleel wat nodig is om 'n heterosigotiese SNP te noem. Soos in [30], het ons C en T getel as 'n enkele alleel by verwysingsitosiene (slegs op die C-string). Benewens k-alleel, het ons ook die Shoemaker-metode [20] probeer, wat glad nie C/T SNP's evalueer nie en waarnemings van die minder gereelde alleel op ten minste 20% van lesings op elke string vereis. Laastens het ons die bisReadMapper-algoritme [3] probeer wat SNP's onafhanklik op elke string oproep deur 'n nie-bisulfiet SNP-oproeper, SAMTOOLS [11], en rapporteer slegs daardie SNP's wat tussen stringe ooreenstem. Figure 3d-f toon dat elke variasie van Bis-SNP beter presteer as ander metodes.

'n Belangrike praktiese vraag is die minimum leesdiepte wat benodig word vir akkurate SNP-identifikasie. Ons het hierdie probleem aangespreek deur ons 32× Bisulfiet-volgende genoom af te neem na verskillende dekkingsvlakke van 2× tot 30× (Figuur 4). Vir elke dekkingsvlak het ons die aantal vals positiewe en vals negatiewe oor 'n reeks Bis-SNP strengheid afsnypunte bepaal deur gebruik te maak van die 1 M SNP skikking data, soos in Figuur 3. Op elke dekking vlak het ons dan die minste streng afsnypunt gekies wat het 'n Vals Ontdekkingskoers (FDR) van minder as 5% geproduseer en die aantal ware positiewe (sensitiwiteit) geplot. Vir beide homosigotiese sitosiene (Figuur 4a) en heterosigotiese SNP's (Figuur 4b), het sensitiwiteit dramaties toegeneem tot ongeveer 10× dekking en dan begin afplat. Homosigotiese SNP's is byna volledig opgespoor (98% sensitiwiteit) deur 10× dekking, terwyl heterosigotiese SNPs 'n meer geleidelike toename gehad het van 80% opgespoor teen 10× tot 95% bespeur by 30×.

Sensitiwiteit as 'n funksie van volgorde dekking. Vergelykings tussen Bis-SNP SNP-oproepe en 1 M SNP-skikking vanaf Figuur 3 ROC-kurwes is uitgebrei na 'n reeks dekkingsvlakke van 2×-30×. Op elke dekkingsvlak het ons die minste streng drempel gekies wat 'n Vals Ontdekkingskoers (FDR) minder as 0.05 opgelewer het, en die Sensitiwiteit (1 - Vals Negatiewe koers) geplot. Soos in Figuur 3, toon afsonderlike plotte sensitiwiteit by die opsporing van homosigotiese sitosiene (a) en heterosigotiese SNP's (b). Vir heterosigotiese SNPs sluit ons die algehele opsporingsyfer (rooi lyn) in, sowel as aparte lyne vir C/T heterosigotiese SNPs (blou lyn) en nie-C/T heterosigotiese SNPs (groen lyn).

Akkuraatheid van genoomwye metileringsoproepe

Om die vermoë van Bis-SNP te verifieer om sitosiene korrek te identifiseer en metileringskwantifisering genoomwyd te verbeter, het ons Bis-SNP oor 'n hele chromosoom gehardloop vir die OTB kolonslymvliesmonster en vier addisionele heelgenoom bisulfiet-volgende monsters (Tabel 1). TCGA normale long en normale bors is gegenereer deur die USC Epigenome Center en in lyn gebring met behulp van BSMAP, terwyl die twee muismetielome gegenereer is deur UCSD en in lyn gebring is met behulp van Novoalign [22]. Looptye vir chromosoom 1 was ongeveer 3 uur met behulp van 'n standaard 12-kern Intel-bediener met 10 GB RAM (Intel, Santa Clara, CA, gewys). Die hele menslike genoom neem ongeveer 30-40 uur op 'n enkele bediener (data nie gewys nie).

Ons het Bis-SNP gebruik om vier klasse sitosiene in die monstergenoom te identifiseer (Figuur 5 en Tabel 2 'Sample genotipes'), en dit geskei deur hul ooreenstemmende volgordes in die verwysingsgenoom (Figuur 5 en Tabel 2 'Verwysingsgenotipes'). Soos getoon in Tabel 2 het ongeveer 0.5-0.6% van verwysings-CpG's in die monstergenoom verlore gegaan, en 0.5-0.6% van CpG's in die monstergenoom het in die verwysing verlore gegaan. Die twee muismonsters het aansienlik hoër SNP-tempo's gehad, vermoedelik as gevolg van ware stamverskille tussen die gekruisde stamme en die C57BL/6J-stam wat vir die muisverwysingsgenoom in volgorde geplaas is. In beide F1-muise het ongeveer 2.5% van verwysings-CpG's in die monstergenoom verlore gegaan, en ongeveer 1.1% van CpG's in die monstergenoom het in die verwysing verlore gegaan.

Akkurate metilering wat SNP's aanroep. Bis-SNP is op vyf verskillende datastelle uitgevoer, enkel-end-volgordebepaling vanaf Colon Mucosa Weefsel [6] (a), twee TCGA-monsters met behulp van gepaarde-end-volgordebepaling van bors- en longweefsels (normaal, nie-kanker), en twee muismonsters met behulp van gepaarde-end-volgordebepaling van [22] (sien Tabel 1). In elke geval is Bis-SNP gebruik om sitosiene in een van vier volgorde konteks in die monster genoom te identifiseer. Vir elke monster genotipe is sitosiene verder gedeel deur hul volgordekonteks in die verwysingsgenoom ('ref CpG', 'ref CpH' of 'refNotC'). Alle sitosiene binne 'n spesifieke kategorie in 'n spesifieke monster is gemiddeld om 'n gemiddelde metileringsvlak te lewer. Die aantal sitosiene in elke kategorie kan in Tabel 2 gevind word.

Ons het volgende gemiddelde metileringsvlakke oor elke monstergenotipe vergelyk (Figuur 5). Soos verwag, was homosigotiese CpHs konsekwent laag, terwyl homosigotiese CpGs konsekwent hoog was, ongeag die ooreenstemmende verwysingsvolgorde. Beide muis frontale korteks breinmonsters het verhoogde vlakke van CpH-metilering getoon soos beskryf in die oorspronklike publikasie [22]. Interessant genoeg het homosigotiese CpG's wat SNP's verteenwoordig het (waar die monster van die verwysingsgenoom verskil het) konsekwent hoër metilering gehad. Dit pas by wat bekend is oor soogdiergenoom-evolusie - evolusionêre C>T-veranderinge vind baie meer gereeld plaas by gemetileerde as ongemetileerde CpG's omdat die C>T-deaminering en deamineringsherstelproses metileringsspesifiek is. Ons het volgende gekyk na heterosigotiese CpG's (Figuur 5, regs). CpG/CpH posisies het metilering omtrent halfpad tussen CpG homosigotiese en CpH homosigotiese posisies gehad. By CpG/ApG of CpG/GpG heterosigotiese posisies kan metilering slegs vir die C-alleel gemeet word, en die metileringstoestand is omtrent dieselfde as homosigotiese CpG's. CpG/TpG heterosigotiese posisies word nie getoon nie, want ons kan nie metilering by hierdie posisies akkuraat meet nie. Saam toon hierdie data dat Bis-SNP genotipe-oproeping akkurate metileringskwantifisering produseer selfs wanneer die monstergenoom van die verwysingsgenoom verskil.


BESPREKING

Voor hierdie studie is slegs intramolekulêre terugvou sintetiese haarnaaldjies (21,23,24,35) gebruik om die teoretiese struktuurvoorspelling te toets dat enige arbitrêre nukleotiedvolgorde 'n driedubbelhelikale DNA kan vorm waarin die identiese stringe in 'n parallelle mode (14). Die huidige eksperimente was daarop gemik om te bepaal of 'n proteïenvrye parallelle intermolekulêre tripleks gevorm kan word. Ons het 'n aantal 14 nt-kleurstof-gekonjugeerde probes en vier 16 bp dupleksteikens ondersoek. Ons bewyse van gel mobiliteit verskuiwing toetse, fluoressensie anisotropie en FRET metings demonstreer dat proteïen-onafhanklike tripleks vorming slegs plaasvind met 'n ds teiken waarin die homoloë sonde en teiken stringe is in die parallelle oriëntasie.

In Figure ​ Figure2 – 4 demonstreer ons, deur gelvertraging, tripleksvorming van akridien-gemerkte ODN'e wat op AB-duplekse gerig is. Die vrystelling van ss-1Acr is gedeeltelik geblus met die vorming van 'n tripleks met die spesifieke haarnaald teiken (Fig. ​ (Fig.2), 2), terwyl die ss-2Acr en ss-3Acr probes fluoresserend gebly het by binding aan enige van teiken (Fig ​ (Fig.3 3 en ​ en4). 4). Dissosiasiekonstantes geëvalueer vanaf die gels vir probes met tussen een en drie akridien-interkaleerders het bevestig dat die interkalators wat aan die suikerfosfaat-ruggraat geheg is met die buigsame pentametileen-skakelaar in die tripleksstruktuur geïntegreer het sonder beduidende vermindering in teikenvolgorde-spesifisiteit. Die bindingsaffiniteit van Acr-gemerkte ODN'e het nie betekenisvol afgehang van die aantal aangehegte akridienmolekules nie, in teenstelling met binding van vrye interkalatorkleurstof aan die intramolekulêre tripleks, waarin twee kleurstofmolekules stabiliseer, maar drie kleurstofmolekules die kort tripleks destabiliseer (24) .

Vanuit teoretiese oorwegings is die parallelle GCG-drieling voorspel om die mees stabiele van alle drieling te wees omdat die G van die derde string drie waterstofbindings aan die GC Watson𠄼rick-paar (14) kan vorm. Trouens, parallelle oriëntasie van twee dG stringe in 'n tripleks gevorm deur een dC en twee dG stringe is geverifieer deur FTIR en Raman spektroskopie (36).

Vorige studies met afwisselende purien/pyrimidien-volgordes in parallelle en anti-parallelle intramolekulêre triplekskonstrukte het 'n konsekwent hoër stabiliteit vir die anti-parallelle volgordes getoon (Tm waardes hoër met 10�ଌ) behalwe vir ATA teenoor AAT, waarvoor die stabiliteit vergelykbaar was (37,38). Spesifieke antiparallelle triplekse is egter nie voorheen met suiwer gemengde volgordes bereik nie. Ons demonstreer in hierdie studie dat die teenwoordigheid van slegs drie pirimidienbasisse in die 14 nt DNA-volgorde 5′-AGAATGTGGCAAAG-3′ lei tot 'n termodinamiese voorkeur vir die parallelle tripleks en 'n hoë selektiwiteit van herkenning van die spesifieke ds-teiken in vergelyking met die ap-teiken.

Chemiese modifikasie-analise het ook die gevolgtrekking ondersteun dat tripleksvorming plaasgevind het met ons Acr-ODN-konjugate eerder as stringverplasing in die dupleks. Soos getoon in Figuur ​ Figuur6, 6, het die A-teikenstring ewe bestand teen OsO gebly4 modifikasie onder versadigende tripleksvormende konsentrasies van die gekonjugeerde ss-2Acr as dieselfde string in die teikendupleks.

Al die data wat in Figure ​ Figure 2 2 – 4 en ​ en6 6 aangebied word, was in ooreenstemming met die vorming van 'n intermolekulêre tripleks waarin die identiese stringe in die parallelle oriëntasie lê. Om hierdie model vir die struktuur verder te staaf, het ons FRET-metings onderneem op die tripleks wat met ss-1Acr gevorm is, waarin die akridien-deel aan die 5′-punt van die ODN was en die teiken gemerk is met BODIPY-Texas Red op die 3& #x02032-einde van óf die A- of B-string. In die parallelle tripleks sal BODIPY-TR en akridien slegs aan dieselfde kant wees wanneer die B-string gemerk is, terwyl die kleurstowwe aan teenoorgestelde punte sal wees wanneer die teiken A-string die BODIPY-TR dra. Die resultate van hierdie eksperimente word in Figuur ​ Figuur7 7 getoon.

Deur die akridienfluoressensie van die vertraagde bande in bane 4𠄶 van Figuur ​ Figuur 7A, 7 A te vergelyk, merk mens op dat beduidende en soortgelyke blus in die ss-1Acr랫* tripleks soos in die ss-1Acr랫* tripleks soos in die ss-01Acr -01 x0002a dupleks, terwyl baie minder blus in die ss-1Acr୺ʬ tripleks plaasgevind het. Dit is presies die resultate wat ons sou voorspel het vir 'n parallelle oriëntasie van die twee identiese stringe in die tripleks.

Uit vorige eksperimente met EtBr-stabilisering van intramolekulêre parallelle triplekse het ons geredeneer dat ander interkalators as akridien groter stabiliteit van die parallelle intermolekulêre tripleks kan bevorder (24). Ons het drie verskillende ODN's gesintetiseer met 'n methidium-deel op verskillende posisies op beide 'n korter skakelaar en 'n langer koppelaar (sien Materiale en Metodes en Fig. ​ Fig.1). 1 ). Nie een van hierdie ODN's het tripleksvorming bevorder nie, maar eerder string-uitruiling veroorsaak (Fig. ​ (Fig. 5B 5 B en C). 'n Addisionele ODN met 'n psoraleen gekoppel aan die 3′-end (Fig.  1) ) het tripleksvorming onder sekere toestande getoon, maar het by ewewig ook gelei tot string-uitruiling (Fig. ​ (Fig.5A). 5 A) Daarom kom ons tot die gevolgtrekking dat hierdie interkalator-konjugate tydelik tripleksvorming kan bevorder tydens herkenning van die teiken dupleks maar as gevolg van 'n meer stabiele interkalasiegeometrie in die dupleks as die tripleksheliks kan die finale ewewigstoestand die string-uitgeruilde dupleks wees.

GEVOLGTREKKINGS

Die gebruik van 'n ss ODN-interkalator-konjugaat het ons in staat gestel om 'n intermolekulêre parallelle tripleks met die 5′-AGAATGTGGCAAAG-3′-volgorde van die Zn-vingerherhaling van die menslike KRAB-proteïengeen op fisiologiese ioniese sterkte en op gels te isoleer. pH en temperature tot 20ଌ. Daar is getoon dat parallelle tripleksvorming op 'n volgorde-spesifieke wyse plaasvind, waardeur geen kompleksvorming gedemonstreer kon word met twee kontrolevolgordes nie, een met die homoloë volgorde in die antiparallelle oriëntasie en 'n ander met 'n nie-spesifieke nukleotiedvolgorde van dieselfde basissamestelling.

Daar is getoon dat akridien aan weerskante geheg is sowel as aan die suikerfosfaatruggraat tussen basisse van die ss ODN-sonde om die parallelle tripleks te stabiliseer. Die verhoging van die aantal akridiengedeeltes het nie hierdie effek aansienlik verhoog of verlaag nie. Verdere bewyse vir die betrokkenheid van beide homoloë stringe in die tripleksstruktuur, eerder as verplasing van die A-string deur die homoloë ss-Acr-konjugaat, is verkry vanaf OsO4-bipiridien modifikasie eksperimente waarin ons volle beskerming van die timiene van die teiken gevind het onder tripleksvormende toestande. ODN'e gemerk met ander interkalators soos 5′-psoraleen of methidium intern of een basis van enige kant het egter string-uitruiling bevorder.

Die parallelle oriëntasie van die akridien-gemerkte ODN-probe en die identiese string in die teiken is bevestig deur FRET-eksperimente in nie-denaturerende gels met behulp van BODIPY-Texas Rooi-gemerkte teikenduplekse.

Ons data toon dat gemengde onreëlmatige basisvolgordes proteïen-onafhanklike intermolekulêre parallelle triplekse kan vorm. Nietemin, die tripleks dissosiasie konstantes is hoog en pogings om die stabiliteit te verbeter met interkalators anders as akridien het gelei tot dupleks string verplasing. Dus, die doel van die gebruik van parallelle tripleks vorming wat feitlik enige gemengde volgorde vir in vivo diagnostiek of kliniese toepassings is nog nie realiseerbaar nie.


Kyk die video: Waarom is Jeruzalem een speciale stad? Vijf redenen door Jacob Keegstra (September 2022).