Inligting

Wat is die verskil tussen tweede en derde generasie volgordebepaling

Wat is die verskil tussen tweede en derde generasie volgordebepaling


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ek skryf die afdeling oor geskiedenis van DNA-volgordebepaling in die inleidingshoofstuk en nadat ek 'n hele paar navorsingsartikels gelees het, is ek steeds verward daaroor. Hier stel ek 'n paar vrae saam om seker te maak dat ek dit reg verstaan.

  1. Is tweedegenerasie-volgordebepaling dieselfde as volgendegenerasie-volgordebepaling?
  2. Is Sanger die eerste generasie opeenvolging?
  3. Is daar van vandag af enige kommersiële 3de generasie volgordebepalingtegnologie in gebruik (of is dit nog in ontwikkeling)?

As daar enige papierverwysing is wat al die bogenoemde kan verduidelik, sal dit regtig wonderlik wees.


Ek neem aan jy bedoel DNA-volgordebepaling (uitgesluit dinge soos RNA-volgorde).

Is Sanger die eerste generasie opeenvolging?

Van Metzker 2010:

Die outomatiese Sanger-metode word beskou as 'n "eerste-generasie" tegnologie

Sommige van die tegnologie wat in ontwikkeling was toe hierdie resensie geskryf is, is nie meer in ontwikkeling nie, maar dit is steeds 'n uitstekende resensie en 'n goeie plek om te begin.

Is tweedegenerasie-volgordebepaling dieselfde as volgendegenerasie-volgordebepaling?

Ook uit Metzker 2010:

en na nuwer metodes word verwys as volgende generasie volgordebepaling (NGS).

Die "nuwe metodes" in die resensie is:

  • Emulsie PCR gebaseer soos Roche/454
  • Vaste fase versterking soos Illumina/Solexa
  • Enkele molekule soos Helicos BioSciences en Pacific Biosciences

Is daar van vandag af enige kommersiële 3de generasie opeenvolgingstegnologie in gebruik (of is dit nog in ontwikkeling)?

Die ontwikkeling van enkelmolekulemetodes (derde item in die bogenoemde lys) het histories langer geneem as die ander twee, daarom word daar soms na hulle verwys as derde generasie. Let egter op hoe Metzker hierbo hulle almal as "volgende generasie" beskou.

'n Onlangse referaat van PacBio self maak die onderskeid tussen stop:

Tweedegenerasie-volgordebepaling (SGS): Volgordebepaling van 'n ensemble van DNA-molekules met was-en-skandeer-tegnieke.

Derdegenerasie-volgordebepaling (TGS): Volgordebepaling van enkele DNA-molekules sonder dat dit nodig is om tussen leesstappe te stop (hetsy ensiematies of andersins).

Uiteindelik dink ek die "generasies" is nuttiger om die "Sanger vs. Not Sanger"-onderskeid te maak. Sanger-volgorde is baie anders as die volgende generasie in terme van watter soort eksperiment jy kan doen en watter soort data jy verkry.

Verlede dit is die getal van 'n generasie meer 'n bemarkingsterm. Byvoorbeeld, onderaan die PacBio-vraestel:

Verklaring van botsing van belange. Alle skrywers is werknemers van Pacific Biosciences en besit aandele in die maatskappy.

In die praktyk kompeteer PacBio met tweede generasie platforms. Dit is in hul belang om te sê hul tegnologie is op 'n "ander vlak" in vergelyking met wat op die mark beskikbaar is, maar in die praktyk is dit debatteerbaar.

In elk geval, om jou vraag te beantwoord:

  • Daar is 'n tegnologie in gebruik en kommersieel beskikbaar wat na verwys is as derde gen (PacBio)
  • Daar was 'n tegnologie in ontwikkeling wat onder die meeste definisies van derde gen (Helicos) val, wat in 2012 bankrot geraak het
  • Daar is 'n tegnologie in ontwikkeling (ON MinION) wat enkelmolekule gebaseer is en na PacBio bekendgestel is, so as PacBio derde generasies is, is MinION ook (alhoewel die MinION blykbaar baie verskil van PacBio)

Lentivirale gids

Om die veiligheid van lentivirus te verhoog, word die komponente wat nodig is vir virusproduksie oor verskeie plasmiede verdeel (3 vir 2de generasie stelsels, 4 vir 3de generasie stelsels). Die komponente van beide stelsels is soos volg:

  • Lentivirale oordragplasmied wat jou insetsel van belang kodeer. Die transgeenvolgorde word omring deur lang terminale herhaling (LTR) volgordes, wat integrasie van die oordragplasmiedvolgordes in die gasheergenoom vergemaklik. Tipies is dit die volgordes tussen en insluitend die LTR's wat geïntegreer word in die gasheergenoom tydens virale transduksie. Baie lentivirale oordragplasmiede is gebaseer op die MIV-1-virus. Om veiligheidsredes is oordragplasmiede almal replikasie-onbevoeg en kan 'n bykomende delesie in die 3'LTR bevat, wat die virus "self-inaktiverend" (SIN) na integrasie maak.
  • Verpakkingsplasmied(e)
  • Omhulselplasmied

Addgene se verpakking en omhulselplasmiede is veralgemeen en geskik vir verskillende seltipes en -stelsels. Wanneer jy jou eksperiment beplan, is die belangrike komponent om te oorweeg en te optimaliseer die oordragplasmied. 2de generasie lentivirale plasmiede gebruik die virale LTR promotor vir geenuitdrukking, terwyl 3de generasie oordragplasmiede 'n baster LTR promotor gebruik (meer inligting hieroor hieronder). Bykomende of gespesialiseerde promotors kan ook in 'n oordragplasmied ingesluit word: die U6-promotor word byvoorbeeld by die pSico-plasmied ingesluit om shRNA-uitdrukking te dryf. Ander kenmerke wat by oordragplasmiede ingesluit kan word, sluit in: Tet- of Cre-gebaseerde regulering en fluoresserende samesmeltings of verslaggewers.
Blaai deur lentivirusplasmiede beskikbaar by Addgene.


Agtergrond

Volgende-generasie volgordebepaling (NGS) tegnologieë het genomiese navorsing dramaties verander. NGS-instrumente, die sogenaamde tweedegenerasie-volgorders, genereer groot volumes data in vergelyking met konvensionele Sanger-volgorders. Voor 2010, hoewel die koste van die lees van 'n hele genoom vinnig afgeneem het, was die gebruik van NGS-tegnologieë steeds beperk tot groot genoomvolgordebepalingsentrums as gevolg van tegniese en logistieke probleme wat verband hou met die werking van die instrumente en vereistes vir rekenaarhardeware en data-analise. Die koms van benchtop-volgorders het opeenvolgingspogings in klein sentrums en laboratoriums versnel. Byvoorbeeld, die 454 GS Junior (GS Jr), wat vroeg in 2010 deur Roche vrygestel is as die eerste bankopvolger, gebruik dieselfde emulsie PCR-tegnologie [1] as die Roche GS FLX. Die Life Technologies Ion PGM (Ion PGM) bankopvolger, wat aan die begin van 2011 bekendgestel is, gebruik halfgeleiertegnologie [2]. Die Illumina MiSeq (MiSeq) bankopvolger het aan die einde van 2011 beskikbaar geword en gebruik dieselfde volgorde-deur-sintese-tegnologie [3, 4] as die Illumina GAII- en HiSeq-volgorders. Met die jaarlikse opkoms van nuwe NGS-instrumente, vereis eksperimentele prosedures soos biblioteekvoorbereiding en ontledingsmetodes voortdurende verbetering.

Tweedegenerasie-volgorders genereer massiewe hoeveelhede kort leeswerk, wat verskil in deurset en lengte van leeswerk wat deur Sanger-volgorders vervaardig word. Om massiewe hoeveelhede kort leeswerk saam te stel, het 'n nuwe soort algoritme met behulp van de Bruijn-grafieke gefloreer, soos geïllustreer deur 'n reeks genoomsamestellers, insluitend ABySS [5], ALLPATHS-LG [6], Velvet [7, 8] en SOAPdenovo [9]. Alhoewel hierdie algoritmes [5-9] ontwikkel is om hoë-gehalte voltooide-graad genome te produseer, bly dit 'n uitdaging om lang kontiges wat oor 'n hele genoom strek, saam te stel. Een van die belangrike faktore in die suksesvolle verkryging van voltooide genome is die oplossing van herhalende streke wat oor die genoom versprei is. Dit is problematies om lang herhalende streke te rekonstrueer deur leesstukke korter as die herhalende streke saam te stel. Gepaarde punte en maatpare is gebruik om hierdie probleem aan te pak. Mate-pare het steierlengte verbeter, maar die resultate met behulp van maat-paar-samestelling was gewoonlik ver van klaar graad [10, 11].

Om hierdie probleem aan te spreek, kan lees langer as herhalende streke 'n oplossing vir die monteringsprobleem bied. Die onlangs bekend gestel derde-generasie Pacific Biosciences RS sequencer (PacBio) stelsel [12] genereer lang lees met 'n gemiddelde lengte van 4.5 kbp en met ewekansig verspreide volgorde foute. Hierdie evolusionêre tegnologie vereis 'n nuwe algoritme om volgordelesings te verwerk vanweë die verskillende aard van sy leeswerk, waarvan die nukleotiedvlak-akkuraatheid slegs 85% is [12]. Daarom korrigeer verskeie algoritmes eers volgordefoute in lees en stel dan die fout-gekorrigeerde lees bymekaar [13-15]. PacBio het die voordeel om lang leeswerk te genereer, maar teen 'n deurset wat laer is as dié van die tweedegenerasie-volgorders. Een van die nadele van PacBio is dat die aanvanklike installasie duurder is as dié van tweedegenerasie-sekwenshouers (Bykomende lêer 1: Tabel S1). Die kombinasie van tweede- en derdegenerasie-volgordedata kan 'n opsie wees [13, 16] hierdie hibriede metodes bied egter beperkte doeltreffendheid omdat dit meer arbeid en verbruiksgoederekoste vereis vir addisionele biblioteekvoorbereiding.

Aangesien verskeie volgordebepalingsinstrumente en sagteware vir genoomvolgordebepaling beskikbaar is en besig is om te ontwikkel, is dit moeilik om die beste een of die beste kombinasie te kies. Prestasievergelykings van NGS-instrumente, insluitend dié van 'n derdegenerasie-volgorder, is voorheen gepubliseer [17-21], maar met inagneming van die vinnige verbetering van NGS-tegnologieë, is gereelde vergelykings waardevol vir die keuse van die platform wat die beste resultate lewer. Daarom het ons 'n opgedateerde vergelykingstudie van tweede- en derdegenerasie-volgorders uitgevoer deur die bakteriële genoom van Vibrio parahaemolyticus, bestaande uit twee chromosome. As gevolg van die teenwoordigheid van twee chromosome met hoër kopiegetalle van rRNA-operone as wat in ander bakterieë gevind word, was dit moeilik om die genoomvolgorde te voltooi [21]. In hierdie studie het ons die rekonstruksie van die V. parahaemolyticus genoom met behulp van huidige volgordebepalings.


Potensiële gebruike van NGS in kliniese praktyk

Kliniese genetika

Daar is talle geleenthede om NGS in kliniese praktyk te gebruik om pasiëntsorg te verbeter, insluitend:

NGS vang 'n breër spektrum van mutasies as Sanger-volgordebepaling vas

Die spektrum van DNA-variasie in 'n menslike genoom bestaan ​​uit klein basisveranderinge (vervangings), invoegings en delesies van DNA, groot genomiese delesies van eksons of hele gene en herrangskikkings soos inversies en translokasies. Tradisionele Sanger-volgordebepaling is beperk tot die ontdekking van vervangings en klein invoegings en skrappings. Vir die oorblywende mutasies word toegewyde toetse gereeld uitgevoer, soos fluoressensie in situ hibridisasie (FISH) vir konvensionele kariotipering, of vergelykende genomiese hibridisasie (CGH) mikroskikkings om submikroskopiese chromosomale kopiegetal veranderinge soos mikrodelesies op te spoor. Hierdie data kan egter ook direk van NGS-volgordebepalingsdata afgelei word, wat die behoefte aan toegewyde toetse uitskakel terwyl die volle spektrum van genomiese variasie in 'n enkele eksperiment geoes word. Die enigste beperkings is geleë in streke wat swak opeenvolgend is of verkeerdelik karteer as gevolg van uiterste guanien/sitosien (GC) inhoud of herhaalde argitektuur, byvoorbeeld die herhaalde uitbreidings onderliggend aan Fragile X-sindroom, of Huntington se siekte.

Genome kan sonder vooroordeel ondervra word

Kapillêre volgordebepaling hang af van voorafkennis van die geen of lokus wat ondersoek word. NGS is egter heeltemal onselektief en word gebruik om volle genome of eksome te ondervra om heeltemal nuwe mutasies en siekteveroorsakende gene te ontdek. In pediatrie kan dit uitgebuit word om die genetiese basis van onverklaarde sindrome te ontrafel. Byvoorbeeld, 'n landwye projek, Deciphering Developmental Disorders, 1 wat by die Wellcome Trust Sanger Institute in samewerking met NHS se kliniese genetikadienste loop, het ten doel om die genetiese basis van onverklaarbare ontwikkelingsagterstande te ontrafel deur die geaffekteerde kinders en hul ouers in volgorde te bepaal om skadelike de novo-variante te ontbloot. Die samevoeging van hierdie molekulêre data met gedetailleerde kliniese fenotipiese inligting was suksesvol in die identifisering van nuwe gene wat gemuteer is in geaffekteerde kinders met soortgelyke kliniese kenmerke.

Die verhoogde sensitiwiteit van NGS laat opsporing van mosaïekmutasies toe

Mosaïekmutasies word verkry as 'n nabevrugtingsgebeurtenis en gevolglik kom dit teen wisselende frekwensie binne die selle en weefsels van 'n individu voor. Kapillêre opeenvolging kan hierdie variante mis, aangesien hulle gereeld vertoon met 'n subtiliteit wat onder die sensitiwiteit van die tegnologie val. NGS-volgordebepaling verskaf 'n baie meer sensitiewe uitlees en kan dus gebruik word om variante te identifiseer wat in net 'n paar persent van die selle woon, insluitend mosaïekvariasie. Daarbenewens kan die sensitiwiteit van NGS-volgordebepaling verder verhoog word, bloot deur diepte van volgordebepaling te verhoog. Dit het gesien dat NGS in diens geneem is vir baie sensitiewe ondersoeke soos die ondervraging van fetale DNA uit moederlike bloed 2 of die dop van die vlakke van tumorselle uit die sirkulasie van kankerpasiënte. 3


Die Sanger-volgordebepalingsmetode

Die Sanger-volgordebepalingsmetode maak staat op dideoksinukleotiede (ddNTP's), 'n tipe deoksinukleosiedtrifosfate (dNTP's), wat 'n 3′-hidroksielgroep het en eerder 'n waterstofatoom het. Wanneer hierdie basisse aan die groeiende DNA-volgorde bind, beëindig hulle replikasie aangesien hulle nie ander basisse kan bind nie. Om Sanger Sequencing uit te voer, voeg jy jou primers by 'n oplossing wat die genetiese inligting bevat wat georden moet word, en verdeel dan die oplossing in vier PCR-reaksies. Elke reaksie bevat 'n met dNTP mengsel met een van die vier nukleotiede wat met 'n ddNTP vervang is (A, T, G en C ddNTP groepe). Aan die einde van die PKR sal elkeen van jou vier reaksies PKR-produkte van verskillende lengtes lewer omdat replikasie lukraak beëindig word. Deur die monsters op 'n jel met 4 bane te laat loop, kan jy die volgorde saamstel aangesien elke volgorde van dieselfde oorspronklike materiaal gerepliseer is. Hier is 'n voorbeeld waar die ddNTP's vetgedruk is en die dNTP's nie:

Jou volgorde is ATGCTCAG.

Jou vier reaksies gee jou:
Reaksie met ddATP: A, ATGCTCA, ATGCTCAG
Reaksie met ddGTP: ATG, ATGCTCAG
Reaksie met ddCTP: ATGC, ATGCTC, ATGCTCAG
Reaksie met ddTTP: AT, ATGCT, ATGCTCAG

Al die reaksies sodra 'n gel loop, sal so lyk (Beeld deur Olwen Reina):

Elke band dui die verskillende lengtes kode aan. Byvoorbeeld, die band is regs onder die "A" simboliseer die volgorde: "ATGCTCA

Kom ons stel ons 'n partytjiespeletjie voor. Die speletjie is 'n raaispeletjie. Hier is hoe dit gespeel word:

Jy dink aan 'n nommer en die groep moet dit raai. Die moeilike deel is dat die nommer 200-syfers lank is. Jy lees die syfers van die nommer in jou kop sonder om 'n geluid te maak. Kort-kort onderbreek 'n persoon jou, en jy vertel vir hulle die enkele syfer waaraan jy net gedink het en waar dit in die volgorde van 200 is. Elke keer as jy onderbreek word, moet jy weer begin. Jy vertrek na 'n paar uur en die groep moet die 200-syfer nommer uitpluis. Hulle moet die inligting wat jy vir hulle gegee het, saamvoeg, byvoorbeeld die 25ste getal was 5, die 40ste getal was 0, ensovoorts. Deur die inligting van hul onderbrekings te gebruik, kan hulle die nommer wat hulle vir jou gegee het herhaal.

Alhoewel dit na die swakste speletjie ter wêreld klink, werk dit baie goed vir volgordebepaling!

Ongelukkig is dit stadig, duur en maak dit (voorheen) staat op radioaktiewe materiale. Dit het wetenskaplikes gedryf om nuwe en beter vorme van genoomvolgordebepaling te ontwikkel.


Volgende-generasie volgorde-uitdagings

Oor die afgelope 10 jaar het volgende generasie volgordebepaling (NGS) met rasse skrede gegroei. Uitsette het gestyg, en koste het gedaal - albei met ordes van grootte. Die NIH-grafiek wat hierdie vordering toon, is so oorbenut dat die belangrikste nut daarvan nou is om verveelde konferensiegangers te help om hul "gonswoordbingo"-kaarte in te vul.

Met meer as 10 000 instrumente wat regoor die wêreld geïnstalleer is, staar ons 'n paradoks in die gesig: die huidige generasie en die volgende generasie is een en dieselfde. "Volgende," in die konteks van volgordebepaling, het amper heeltemal sy betekenis verloor. Ons kan net sowel aanvaar dat "volgende generasie volgordebepaling" nou net "volgorde" is.

Die belangrikste platformmaatskappye het die afgelope paar jaar daarop gefokus om die gebruiksgemak te verbeter. Illumina se nuwer rekenaarstelsels, soos die NextSeq-, MiSeq- en MiniSeq-stelsels, werk almal deur die gebruik van reagenspatrone, wat die aantal manipulasies en "hands on"-tyd verminder.

Die Ion Torrent-platforms van Thermo Fisher Scientific was histories moeiliker om te gebruik as die Illumina-platforms. Thermo se mees onlangse stelsel, die Ion S5, is egter spesifiek ontwerp om die hele werkvloei te vereenvoudig, van biblioteekvoorbereiding tot datagenerering.

Nadat die toevallige waarnemer gehoor het van die vele verbeterings in volgordebepaling - groter uitset, laer koste en beter gebruiksgemak - kan die toevallige waarnemer hom voorstel dat al die harde werk gedoen is en dat al die hindernisse tot vordering verwyder is. Maar die harde werk het pas begin, en baie uitdagings bly oor.

Een van die eerste areas waar probleme kan insluip, is dikwels die mees oor die hoof gesien—steekproefkwaliteit. Alhoewel platforms dikwels getoets en vergelyk word met behulp van hoogs saamgestelde monsters (soos die verwysingsmateriaal van die Genome in a Bottle Consortium), bied werklike monsters dikwels veel meer van 'n uitdaging.

Vir menslike volgordebepaling is een van die gewildste monstertipes FFPE (formalien-gefixeerde paraffien-ingebed). FFPE is gewild vir 'n verskeidenheid redes, nie die minste daarvan is die blote oorvloed van FFPE monsters. Volgens sommige skattings word meer as 'n miljard FFPE-monsters regoor die wêreld geargiveer. Hierdie getal sal aanhou groei noudat die berging van kliniese monsters in FFPE-blokke 'n industriewye standaardpraktyk geword het.

Behalwe dat dit wyd beskikbaar is, bevat FFPE-monsters dikwels ongelooflike nuttige fenotipiese inligting. Byvoorbeeld, FFPE-monsters word dikwels geassosieer met mediese behandeling en kliniese uitkomsdata.

Die probleem met FFPE-monsters is dat beide die proses van fiksasie en die bergingstoestande uitgebreide DNA-skade kan veroorsaak. “In die evaluering van meer as 1 000 monsters op BioCule se QC-platform, het ons geweldige variasie in die hoeveelheid en tipes skade in monster-DNS gesien, soos inter- en intrastring-kruisbindings, opeenhoping van enkelstring-DNS, en enkelstring-DNS-breuke, ” sê Hans G. Thormar, Ph.D., medestigter en HUB van BioCule.

Die veranderlike hoeveelhede en tipes skade, indien geïgnoreer, kan die finale resultate negatief beïnvloed. "Die impak op stroomaf toepassings soos volgordebepaling kan groot wees: van eenvoudige biblioteekmislukkings tot biblioteke wat vals data produseer, wat lei tot waninterpretasie van die resultate," gaan dr. Thormar voort. Daarom is dit van kritieke belang om die kwaliteit van elke monster behoorlik te assesseer aan die begin van die volgordebepalingsprojek.


In die volgende generasie volgorde-werkvloei kan monsters van lae of veranderlike gehalte stroomaf prosesse soos biblioteekvoorbereiding korrupteer en uiteindelik analise verwar. Monsters moet geassesseer word vir kruisbindings, breek, die ophoping van enkelstrengs DNA en ander vorme van skade.

Biblioteekvoorbereiding

Alhoewel die belangrikste opeenvolgingsplatformmaatskappye jare spandeer het om die koste van die generering van rou volgorde te verlaag, was dieselfde nie waar vir biblioteekvoorbereiding nie. Biblioteekvoorbereiding vir menslike heelgenoom-volgordebepaling, teen ongeveer $50 per monster, is steeds 'n relatief geringe deel van die totale koste. Maar vir ander toepassings, soos volgordebepaling van bakteriese genome of lae-diepte RNA-volgordebepaling (RNA-volgorde), kan dit die grootste deel van die koste uitmaak.

Verskeie groepe werk aan multiplekse tuisbrouoplossings om die effektiewe koste te verlaag, maar daar was nie baie ontwikkelings op die kommersiële front nie. Een ligpunt is in die ontwikkeling van oplossings vir enkelselvolgordebepaling, soos die Chromium™-stelsel van 10X Genomics, wat 'n kraalgebaseerde stelsel gebruik om honderde tot duisende monsters parallel te verwerk.

"Ons sien enkelsel-RNA-seq as die regte manier om geen-uitdrukking-analise te doen," dring daarop aan Serge Saxonov, Ph.D., medestigter en uitvoerende hoof van 10X Genomics. "Oor die volgende paar jaar sal 'n groot deel van die wêreld oorgaan na enkelsel-resolusie vir RNA-eksperimente, en ons is opgewonde vir ons platform om die pad daarheen te lei." Vir groot projekte, soos dié wat nodig is vir enkelsel-RNA-volgorde, sal hoogs vermenigvuldigde oplossings krities wees om die koste per monster redelik laag te hou.

Kort lees vs. lang lees

Illumina se oorheersing van die opeenvolgingsmark het beteken dat die oorgrote meerderheid van die data wat tot dusver gegenereer is, op kort leeswerk gebaseer is. Om 'n groot aantal kort leesstukke te hê is 'n goeie pas vir 'n aantal toepassings, soos die opsporing van enkelnukleotied polimorfismes in genomiese DNA en die tel van RNA-transkripsies. Kort leeswerk alleen is egter onvoldoende in 'n aantal toepassings, soos om deur hoogs herhalende streke van die genoom te lees en langafstandstrukture te bepaal.

Langleesplatforms, soos die RSII en Sequel van Pacific Biosciences en die MinION van Oxford Nanopore Technologies, is gereeld in staat om leeswerk in die 15–20 kilobasis (kb) reeks te genereer, met individuele leeswerk van meer as 100 kb wat aangemeld is. Sulke platforms het die respek verdien van wetenskaplikes soos Charles Gasser, Ph.D., professor in molekulêre en sellulêre biologie aan die Universiteit van Kalifornië, Davis.

"Ek is beïndruk met die sukses wat mense behaal het met die gebruik van die langleesmetodes vir de novo genoomsamestelling, veral in hibriede samestellings wanneer dit gekombineer word met kortleesdata van hoër getrouheid," sê dr. Gasser. "Hierdie kombinasie van tegnologieë maak dit moontlik vir 'n enkele ondersoeker met 'n baie klein groepie en 'n minimale begroting om 'n bruikbare samestelling uit 'n nuwe organisme se genoom te produseer."

Om die meeste uit hierdie langleesplatforms te kry, is dit egter nodig om nuwe metodes vir die voorbereiding van DNS-monsters te gebruik. Standaard molekulêre biologie metodes is nie geoptimaliseer vir die isolering van ultra-lang DNA-fragmente nie, so spesiale sorg moet geneem word wanneer langleesbiblioteke voorberei word.

Verkopers het byvoorbeeld spesiale "hoë molekulêre gewig"-stelle geskep vir die isolasie van DNS-fragmente >100 kb, en geteikende DNS-protokolle is gewysig om selektief te verryk vir groot fragmente DNS. Hierdie nuwe metodes en tegnieke moet bemeester word om maksimum langlees-opbrengs te verseker.

As 'n alternatief vir ware langlesings, wend sommige hulle tot 'n gespesialiseerde vorm van kortlesings wat gekoppelde leeswerk genoem word, soos dié van 10X Genomics. Gekoppelde leeswerk word gegenereer deur 'n unieke strepieskode by te voeg by elke kort lees wat gegenereer word vanaf 'n enkele lang DNA-fragment, wat gewoonlik >100 kb is. Die unieke strepieskodes word gebruik om die individuele kortlesings tydens die ontledingsproses aan mekaar te koppel. Dit verskaf langafstand genomiese inligting, wat die konstruksie van groot haplotipe blokke en toeligting van komplekse strukturele inligting moontlik maak.

"Kortlees-volgordebepaling, hoewel uiters kragtig as gevolg van hoë akkuraatheid en deurset, kan slegs toegang verkry tot 'n fraksie van genomiese inhoud," adviseer dr. Saxonov. "Dit is omdat genome aansienlik herhalend is en baie van die inligting in die genoom op lang skale geënkodeer word."


Sommige volgordebepalingtoepassings, soos die opsporing van enkelnukleotiedpolimorfismes, kan met kortleestegnologie bestuur word. Ander toepassings, soos die opsporing van strukturele variante, kan langleestegnologie vereis, en sommige toepassings, soos die samestelling van 'n nuwe organisme se genoom, kan 'n gekombineerde benadering vereis, met kort leeswerk wat akkuraatheid en hoë deurset verskaf, waar moontlik, en lang leeswerk wat hoogs herhalende genomiese streke hanteer. [ktsimage/Getty Images]

Data-analise

Nog 'n uitdaging wat navorsers in die gesig staar, is die groot hoeveelheid data wat gegenereer word. Die BAM-lêer ('n semi-saamgeperste belyningslêer) vir 'n enkele 30X menslike heelgenoommonster is ongeveer 90 GB. ’n Relatief beskeie projek van 100 monsters sal 9 TB se BAM-lêers genereer.

Met 'n enkele Illumina HiSeq X-instrument wat meer as 130 TB data per jaar kan genereer, kan berging vinnig 'n bekommernis word. Byvoorbeeld, die Broad Institute genereer volgordedata teen die tempo van een 30X genoom elke 12 minute—byna 4 000 TB se BAM-lêers elke jaar.

BAM-lêers kan in VCF-lêers (variant call format) omgeskakel word, wat slegs inligting bevat op daardie basisse wat verskil van die verwysingsvolgorde. Alhoewel die VCF-lêers baie kleiner en makliker is om mee te werk, is dit steeds nodig om die rou volgordelêers te behou as die navorser die data in die toekoms wil herverwerk.

Soos die koste van volgordebepaling afgeneem het, het sommige tot die gevolgtrekking gekom dat die hervolgorde van monsters waarvoor daar oorvloedige materiaal is makliker en moontlik selfs goedkoper is. En wanneer dit kom by die ontleding van hierdie groot hoeveelheid data, word navorsers bederf met keuse. Trouens, met meer as 3 000 volgorde-analise-instrumente wat by OMICtools gelys word ('n gids wat deur omicX bedryf word), kan navorsers maklik oorweldig word wanneer hulle probeer om die beste opsie te vind.

Kliniese interpretasie en vergoeding

Laastens, vir kliniese monsters, bly daar die uitdaging om 'n konsekwente, betroubare interpretasie van die volgordebepalingsvariante te lewer, veral as dit betrekking het op pasiëntsorg. 'n Tipiese eksoommonster sal tussen 10 000 tot 20 000 variante hê, terwyl 'n heelgenoomsteekproef oor die algemeen meer as 3 miljoen sal hê. Om dinge meer hanteerbaar te maak, word die variante dikwels gefiltreer op grond van hul waarskynlikheid om siektes te veroorsaak.

Om klinici te help lei, het die Amerikaanse Kollege vir Mediese Genetika en Genomika, die Vereniging vir Molekulêre Patologie en die Kollege van Amerikaanse Patoloë 'n stelsel geskep om variante te klassifiseer. Kategorieë sluit in patogenies, waarskynlik patogenies, onseker betekenis (wat tans die oorgrote meerderheid in eksoom- en heelgenoommonsters uitmaak), waarskynlik benigne en benigne.

Sulke skemas het egter hul beperkings. Selfs wanneer 'n gemeenskaplike klassifikasieskema op identiese datastelle gebruik word, kan verskillende groepe met verskillende interpretasies vorendag kom. In 'n loodsstudie onder die nuwe stelsel het die deelnemende kliniese laboratoriums slegs ongeveer 34% van die tyd ooreengekom oor hul klassifikasies.

In gevalle waar daar onenigheid is of bykomende ontleding nodig is om die resultate te interpreteer, word die probleem van terugbetaling die padblokkade. Terugbetaling van NGS-gebaseerde toetse kan 'n groot uitdaging wees, maar vergoeding vir interpretasie is byna onmoontlik.

"Daar is geen manier vir laboratoriums om vir interpretasie rekening te hou nie," argumenteer Jennifer Friedman, M.D., kliniese ondersoeker by Rady Children's Institute for Genomic Medicine. "Dit is 'n baie waardevolle diens wat beskikbaar kan wees, maar niemand is regtig in daardie ruimte nie.

"Daar is geen manier om daarvoor te faktureer nie - versekeringsmaatskappye sal nie daarvoor betaal nie. Ten spyte van toenemende fokus op presisiemedisyne, of interpretasie deur die klinikus of deur die laboratorium is, word hierdie belangrikste aspek nie deur die gesondheidsorgbetalers erken of gewaardeer nie.”

Totdat dit verander, moet die ontleding van hierdie pasiëntmonsters in wese as 'n navorsingsprojek hanteer word, 'n opsie wat gewoonlik slegs in 'n navorsingshospitaalopset beskikbaar is, en slegs vir 'n beperkte aantal pasiënte.

Sien uit

Soveel vooruitgang as wat daar die afgelope paar jaar was, bly baie uitdagings oor die hele NGS-werkvloei, van monstervoorbereiding tot data-analise. En soos nuwe vooruitgang gemaak word in die onderliggende tegnologieë, sal nuwe uitdagings voortgaan om na vore te kom. Om hierdie uitdagings aan te pak sal van kritieke belang wees om die wye aanvaarding van hierdie genomiese tegnologieë te verseker en om die impak daarvan op menslike gesondheid te maksimeer.

Die lank en kort van strukturele variante

Alhoewel volgende generasie volgordebepaling bygedra het tot vinnige vordering in ons vermoë om enkelbasis genetiese variasie op te spoor, is nog 'n hele kategorie variante uit die prentjie gelaat weens die aard van die kortleesreekse wat deur hierdie platforms geproduseer word. Hierdie variante is te klein om met sitogenetiese metodes op te spoor, maar te groot om betroubaar te ontdek met kortleesvolgordebepaling. Dit is geen geringe saak nie: elke menslike genoom bevat ongeveer 20 000 strukturele variante, en daar is getoon dat baie siektes veroorsaak.

Enkelmolekule, intydse (SMRT) volgordebepalingstegnologie los die uitdaging op om hierdie strukturele variante met hoë sensitiwiteit te identifiseer, deels as gevolg van die fundamenteel lang leeswerk wat dit produseer. SMRT-volgordebepaling produseer leeswerk wat baie kilobasisse lank is - vergeleke met 200 of 300 basisse vir kortleesvolgorders - sodat hulle die meeste strukturele variante soos invoegings, skrappings, dupliserings, inversies, herhaalde uitbreidings en meer volledig kan oplos.

Baie studies gebruik nou langgeleesde SMRT-volgordedata vir die ontdekking van strukturele variante. In 'n projek wat verlede jaar by die American Society of Human Genetics aangebied is, is die NA12878-mensmonster volgens 10-voudige dekking op Pacific Biosciences se Sequel System opgevolg, en strukturele variante is genoem met die Baylor College of Medicine se PBHoney-instrument.

Hierdie benadering het byna 90% van strukturele variante in die genoom gevind, gebaseer op 'n vergelyking met 'n Genoom in a Bottle-waarheidstel. Verder het langleesdekking duisende nuwe variante geïdentifiseer wat nie in kortleesdatastelle gevind is nie, waarvan die meeste deur de novo-samestelling bevestig is.

Aangesien pogings oorgaan na ontleding van strukturele variante in groot kohorte, is dit belangrik om 'n balans tussen sensitiwiteit en koste te vind. Lae-vou SMRT-volgorde dekking het die potensiaal om 'n effektiewe en bekostigbare oplossing vir strukturele variant ontdekking in menslike genome te wees, en die voordele geld ook vir ander komplekse genome.


Sedert die Human Genome Project het die koste van volgordebepaling van genome meer as duisendvoudig afgeneem.

Sedert die Menslike Genoomprojek het die ontwikkeling van nuwer en beter DNS-volgordebepalingstegnologie daartoe gelei dat die koste van volgordebepaling van genome meer as duisendvoudig afgeneem het. Nie gouer het die volgende generasie opeenvolging die mark bereik nie, of 'n derde generasie volgordebepaling is ontwikkel.

SMRT stel wetenskaplikes in staat om DNS-polimerase effektief te 'afluister'.

Een van hierdie nuwe tegnologieë is ontwikkel deur Pacific Biosciences en word Single-Molecule Sequencing in Real Time (SMRT) genoem. Hierdie sisteem behels 'n enkelstrengige DNA-molekule wat aan 'n DNA-polimerase-ensiem heg. Die DNS word georden soos die DNS-polimerase komplementêre fluorescent-gemerkte basisse by die DNS-string voeg. Soos elke gemerkte basis bygevoeg word, word die fluoresserende kleur van die basis aangeteken voordat die fluoresserende etiket afgesny word. Die volgende basis in die DNS-ketting kan dan bygevoeg en aangeteken word.

SMRT is baie doeltreffend wat beteken dat minder duur chemikalieë gebruik hoef te word. Dit is ook ongelooflik sensitief, wat wetenskaplikes in staat stel om DNS-polimerase effektief te 'afluister' en waar te neem dat dit 'n string DNS maak.

Die enkelmolekule-volgorde in reële tyd (SMRT) ontwikkel deur Pacific Biosciences.
Beeldkrediet: Genome Research Beperk

SMRT kan baie lang lees van volgorde van 10-15 kilobasisse lank genereer.

SMRT kan baie vinnig lees van volgorde (10-15 kilobasisse lank) van enkele DNA-molekules genereer, baie vinnig. Die vervaardiging van lang lees is baie belangrik, want dit is makliker om genome saam te stel uit langer fragmente van DNA. Dit beteken ook dat vir klein genome die volledige volgorde verkry kan word sonder die behoefte aan die duur en tydrowende gaping sluiting metodes wat ander tegnologie vereis.

Met derde generasie volgordebepaling kan wetenskaplikes nou begin om genome te herrangskik om 'n hoër vlak van akkuraatheid te bereik.

Met die bekendstelling van sulke sensitiewe en goedkoop volgordebepalingsmetodes kan wetenskaplikes nou begin om genome te herrangskik wat reeds in volgorde geplaas is om 'n hoër vlak van akkuraatheid te bereik. Gebruik byvoorbeeld SMRT, Escherichia coli is nou gerangskik tot 'n akkuraatheid van 99,9999 persent!

Die volgorde van die menslike genoom op hierdie manier sal vir 'n rukkie nie moontlik wees nie, maar wanneer dit is, voorspel wetenskaplikes dat dit moontlik sal wees om 'n hele menslike genoom binne ongeveer 'n uur te volgorde.

Slegs 'n dekade van die Menslike Genoomprojek af en DNS word nou baie vinniger en doeltreffender opvolg.

'n Grafiek wat wys hoe die spoed van DNA-volgordebepalingstegnologieë sedert die vroeë tegnieke in die 1980's toegeneem het.
Beeldkrediet: Genome Research Beperk


Vergelyking van volgende generasie volgordestelsels

Met vinnige ontwikkeling en wye toepassings van volgende-generasie volgordebepaling (NGS) tegnologieë, is genomiese volgorde inligting binne bereik om die bereiking van doelwitte te help om lewensraaisels te dekodeer, beter oeste te maak, patogene op te spoor en lewenskwaliteite te verbeter. NGS-stelsels word tipies verteenwoordig deur SOLiD/Ion Torrent PGM van Life Sciences, Genome Analyzer/HiSeq 2000/MiSeq van Illumina, en GS FLX Titanium/GS Junior van Roche. Beijing Genomics Institute (BGI), wat oor die wêreld se grootste volgordebepalingskapasiteit beskik, het verskeie NGS-stelsels, insluitend 137 HiSeq 2000, 27 SOLiD, een Ion Torrent PGM, een MiSeq en een 454-volgorder. Ons het uitgebreide ondervinding opgedoen in monsterhantering, volgordebepaling en bioinformatika-analise. In hierdie vraestel word tegnologieë van hierdie stelsels hersien, en eerstehandse data uit uitgebreide ervaring word opgesom en ontleed om die voordele en besonderhede wat met elke volgordestelsel geassosieer word, te bespreek. Uiteindelik word toepassings van NGS opgesom.

1. Inleiding

(Deoksiribonukleïensuur) DNA is gedemonstreer as die genetiese materiaal deur Oswald Theodore Avery in 1944. Die dubbelheliese stringstruktuur wat uit vier basisse saamgestel is, is in 1953 deur James D. Watson en Francis Crick bepaal, wat gelei het tot die sentrale dogma van molekulêre biologie. In die meeste gevalle het genomiese DNS die spesie en individue gedefinieer, wat die DNS-volgorde fundamenteel maak vir die navorsing oor die strukture en funksies van selle en die dekodering van lewensraaisels [1]. DNS-volgordebepalingstegnologieë kan bioloë en gesondheidsorgverskaffers help in 'n wye reeks toepassings soos molekulêre kloning, teling, vind van patogene gene, en vergelykende en evolusiestudies. DNS-volgordebepalingstegnologieë behoort ideaal vinnig, akkuraat, maklik om te bedryf en goedkoop te wees. In die afgelope dertig jaar het DNS-volgordebepalingstegnologieë en -toepassings geweldige ontwikkeling ondergaan en dien as die enjin van die genoomera wat gekenmerk word deur 'n groot hoeveelheid genoomdata en gevolglik 'n wye reeks navorsingsareas en veelvuldige toepassings. Dit is nodig om terug te kyk na die geskiedenis van volgordebepaling tegnologie-ontwikkeling om die NGS-stelsels (454, GA/HiSeq, en SOLiD) te hersien, om hul voor- en nadele te vergelyk, die verskillende toepassings te bespreek en die onlangs ingevoerde PGM te evalueer ( persoonlike genoommasjiene) en derdegenerasie-volgordebepalingstegnologieë en toepassings. Al hierdie aspekte sal in hierdie artikel beskryf word. Die meeste data en gevolgtrekkings is van onafhanklike gebruikers wat uitgebreide eerstehandse ondervinding in hierdie tipiese NGS-stelsels in BGI (Beijing Genomics Institute) het.

Voordat ons oor die NGS-stelsels praat, wil ons die geskiedenis van DNS-volgordebepaling kortliks hersien. In 1977 het Frederick Sanger DNS-volgordebepalingstegnologie ontwikkel wat gebaseer was op kettingbeëindigingsmetode (ook bekend as Sanger-volgordebepaling), en Walter Gilbert het 'n ander volgordebepalingstegnologie ontwikkel gebaseer op chemiese modifikasie van DNS en daaropvolgende splitsing by spesifieke basisse. As gevolg van sy hoë doeltreffendheid en lae radioaktiwiteit, is Sanger-volgordebepaling aangeneem as die primêre tegnologie in die "eerste generasie" van laboratorium- en kommersiële volgordebepalingtoepassings [2]. Op daardie tydstip was DNS-volgordebepaling moeisaam en was radioaktiewe materiale nodig. Na jare se verbetering het Applied Biosystems die eerste outomatiese volgordebepalingsmasjien (naamlik AB370) in 1987 bekendgestel, wat kapillêre elektroforese aangeneem het wat die volgordebepaling vinniger en meer akkuraat gemaak het. AB370 kon een keer 96 basisse opspoor, 500 K basisse per dag, en die leeslengte kan 600 basisse bereik. Die huidige model AB3730xl kan 2,88 M basisse per dag uitvoer en die leeslengte kan 900 basisse bereik sedert 1995. Die outomatiese volgordebepalingsinstrumente en gepaardgaande sagteware wat die kapillêre volgordebepalingsmasjiene en Sanger-volgordebepalingstegnologie gebruik, het in 1998 ontstaan ​​​​het die hoofinstrumente geword vir die voltooiing van menslike genoomprojek in 2001 [3]. Hierdie projek het die ontwikkeling van kragtige nuwe volgordebepalingsinstrumente grootliks gestimuleer om spoed en akkuraatheid te verhoog, terwyl koste en mannekrag tegelykertyd verminder is. Nie net dit nie, X-prys het ook die ontwikkeling van volgende generasie volgordebepaling (NGS) versnel [4]. Die NGS-tegnologieë verskil van die Sanger-metode in aspekte van massiewe parallelle analise, hoë deurset en verminderde koste. Alhoewel NGS genoomvolgordes handig maak, is die gevolgde data-analise en biologiese verduidelikings steeds die bottelnek om genome te verstaan.

Na aanleiding van die menslike genoomprojek is 454 in 2005 deur 454 van stapel gestuur, en Solexa het die volgende jaar Genome Analyzer vrygestel, gevolg deur (Opeenvolging deur Oligo Ligation Detection) SOLiD verskaf van Agencourt, wat drie mees tipiese massief parallelle volgordebepalingstelsels in die volgende- generasie-volgordebepaling (NGS) wat goeie prestasie op deurset, akkuraatheid en koste gedeel het in vergelyking met Sanger-volgordebepaling (getoon in Tabel 1(a)). Hierdie stigtermaatskappye is toe deur ander maatskappye gekoop: in 2006 is Agencourt deur Applied Biosystems gekoop, en in 2007 is 454 deur Roche gekoop, terwyl Solexa deur Illumina gekoop is. Na jare van evolusie, vertoon hierdie drie stelsels beter werkverrigting en hul eie voordele in terme van leeslengte, akkuraatheid, toepassings, verbruiksgoedere, mannekragvereistes en informatika-infrastruktuur, ensovoorts.Die vergelyking van hierdie drie stelsels sal in die latere deel van hierdie referaat gefokus en bespreek word (sien ook Tabelle 1(a), 1(b) en 1(c)).

2. Roche 454-stelsel

Roche 454 was die eerste kommersieel suksesvolle volgende generasie stelsel. Hierdie opeenvolger gebruik pyrosequencing-tegnologie [5]. In plaas daarvan om dideoksinukleotiede te gebruik om die kettingamplifikasie te beëindig, maak pirosequencing-tegnologie staat op die opsporing van pirofosfaat wat tydens nukleotiedinkorporasie vrygestel word. Die biblioteek DNA's met 454-spesifieke adapters word gedenatureer in enkelstreng en vasgevang deur amplifikasiekrale gevolg deur emulsie PCR [6]. Dan op 'n pikotiterplaat sal een van dNTP (dATP, dGTP, dCTP, dTTP) aanvul tot die basisse van die sjabloonstring met behulp van ATP sulfurilase, luciferase, luciferien, DNA polimerase, en adenosien 5' fosfosulfaat (APS) en vrystelling van pirofosfaat (PPi) wat gelyk is aan die hoeveelheid geïnkorporeerde nukleotied. Die ATP wat van PPi getransformeer word, dryf die luciferien na oksielusiferien en genereer sigbare lig [7]. Terselfdertyd word die ongeëwenaarde basisse afgebreek deur apirase [8]. Dan word nog 'n dNTP by die reaksiesisteem gevoeg en die pyrovolgordebepalingsreaksie word herhaal.

Die leeslengte van Roche 454 was aanvanklik 100–150 bp in 2005, 200 000+ lesings, en kon 20 Mb per lopie lewer [9, 10]. In 2008 is 454 GS FLX Titanium-stelsel deur opgradering bekendgestel, sy leeslengte kon 700 bp bereik met 'n akkuraatheid van 99.9% na filter en lewer 0.7 G data per lopie binne 24 uur. Aan die einde van 2009 het Roche die GS Junior 'n bankstelsel in die 454-volgordestelsel gekombineer wat die biblioteekvoorbereiding en dataverwerking vereenvoudig het, en uitset is ook opgegradeer na 14 G per lopie [11, 12]. Die mees uitstaande voordeel van Roche is sy spoed: dit neem slegs 10 uur vanaf die begin van die volgorde tot voltooiing. Die leeslengte is ook 'n kenmerkende karakter in vergelyking met ander NGS-stelsels (beskryf in die latere deel van hierdie vraestel). Maar die hoë koste van reagense bly 'n uitdaging vir Roche 454. Dit is sowat $

per basis (slegs telreagensgebruik). Een van die tekortkominge is dat dit 'n relatief hoë foutkoers het in terme van poli-basisse langer as 6 bp. Maar die biblioteekkonstruksie kan geoutomatiseer word, en die emulsie-PCR kan semi-geoutomatiseerd wees wat die mannekrag in 'n groot mate kan verminder. Ander voordele vir informatika-infrastruktuur en volgordebepaling word in Tabelle 1(a), 1(b) en 1(c) met HiSeq 2000 en SOLiD-stelsels gelys en vergelyk.

2.1. 454 GS FLX Titaan sagteware

GS RunProcessor is die hoofdeel van die GS FLX Titanium-stelsel. Die sagteware is in beheer van beeld-agtergrond-normalisering, seinliggingskorreksie, kruisspraakkorreksie, seinomskakeling en volgorde-datagenerering. GS RunProcessor sal elke keer na hardloop 'n reeks lêers produseer, insluitend SFF (standaard vloeigram formaat) lêers. SFF-lêers bevat die basis genoem rye en ooreenstemmende kwaliteit tellings vir alle individuele, hoë kwaliteit lees (gefiltreerde lees). En dit kan direk vanaf die skerm van die GS FLX Titanium-stelsel bekyk word. Deur gebruik te maak van GS De Novo Assembler, GS Reference Mapper en GS Amplicon Variant Analyzer wat deur GS FLX Titanium-stelsel verskaf word, kan SFF-lêers in multi-aspekte toegepas word en in fastq-formaat omgeskakel word vir verdere data-ontleding.

3. AB SOLiD-stelsel

(Opeenvolging deur Oligo Ligation Detection) SOLiD is in 2006 deur Applied Biosystems gekoop. Die volgordebepaling gebruik die tegnologie van twee-basis volgordebepaling gebaseer op ligasie volgordebepaling. Op 'n SOLiD-vloeisel kan die biblioteke gerangskik word deur 8 basis-probe-ligasie wat ligasieplek (die eerste basis), splitsingsplek (die vyfde basis) en 4 verskillende fluoresserende kleurstowwe (gekoppel aan die laaste basis) bevat [10]. Die fluoresserende sein sal aangeteken word tydens die probes komplementêr tot die sjabloonstring en verdwyn deur die splitsing van probes se laaste 3 basisse. En die volgorde van die fragment kan afgelei word na 5 rondes van opeenvolging met behulp van leer primer stelle.

Die leeslengte van SOLiD was aanvanklik 35 bp-lesings en die uitset was 3 G data per lopie. As gevolg van twee-basis volgordebepaling metode, kan SOLiD 'n hoë akkuraatheid van 99.85% bereik na filtering. Aan die einde van 2007 het ABI die eerste SOLiD-stelsel vrygestel. Aan die einde van 2010 is die SOLiD 5500xl-volgordestelsel vrygestel. Van SOLiD tot SOLiD 5500xl, vyf opgraderings is binne net drie jaar deur ABI vrygestel. Die SOLiD 5500xl het verbeterde leeslengte, akkuraatheid en data-uitset van onderskeidelik 85 bp, 99.99% en 30 G per lopie gerealiseer. 'n Volledige lopie kan binne 7 dae voltooi word. Die volgordekoste is ongeveer

per basis geskat uit reagensgebruik slegs deur BGI-gebruikers. Maar die kort leeslengte en hervolgorde slegs in toepassings is steeds sy groot tekortkoming [13]. Toepassing van SOLiD sluit in heelgenoomherrangskikking, geteikende hervolgordebepaling, transkriptoomnavorsing (insluitend geenuitdrukkingsprofiele, klein RNA-analise en heeltranskriptomanalise), en epigenoom (soos ChIP-Seq en metilering). Soos ander NGS-stelsels, is SOLiD se rekenaarinfrastruktuur duur en nie triviaal om dit te gebruik nie, vereis 'n lugversorgde datasentrum, rekenaarkluster, vaardige personeel in rekenaars, verspreide geheuekluster, vinnige netwerke en bondelwagstelsel. Die bedryfstelsel wat deur die meeste navorsers gebruik word, is GNU/LINUX. Elke soliede sequencer-lopie neem 7 dae en genereer ongeveer 4 TB se rou data. Meer data sal na bioinformatika-analise gegenereer word. Hierdie inligting word gelys en vergelyk met ander NGS-stelsels in Tabelle 1(a), 1(b) en 1(c). Outomatisering kan gebruik word in biblioteek voorbereidings, byvoorbeeld, Tecan stelsel wat 'n Covaris A en Roche 454 REM e stelsel geïntegreer [14].

3.1. SOLiD sagteware

Na die volgorde met SOLiD, sal die oorspronklike volgorde van kleurkodering opgehoop word. Volgens dubbelbasis-koderingsmatriks kan die oorspronklike kleurvolgorde gedekodeer word om die basisvolgorde te kry as ons die basistipes vir een van enige posisie in die ry geken het. As gevolg van 'n soort kleur wat ooreenstem met vier basispaar, sal die kleurkodering van die basis die dekodering van sy volgende basis direk beïnvloed. Dit het gesê dat 'n verkeerde kleurkodering 'n ketting-dekoderingsfoute sal veroorsaak. BioScope is 'n SOLiD-data-analise-pakket wat 'n bekragtigde, enkele raamwerk vir hervolgorde-, ChIP-Seq- en hele transkripsie-analise bied. Dit hang af van verwysing vir die opvolgdata-analise. Eerstens omskep die sagteware die basisreekse van verwysings in kleurkoderingsvolgorde. Tweedens word die kleurkoderingvolgorde van verwysings vergelyk met die oorspronklike volgorde van kleurkodering om die inligting van kartering met nuutontwikkelde karteringalgoritme MaxMapper te kry.

4. Illumina GA/HiSeq-stelsel

In 2006 het Solexa die Genome Analyzer (GA) vrygestel, en in 2007 is die maatskappy deur Illumina gekoop. Die volgordehouer gebruik die tegnologie van volgordebepaling deur sintese (SBS). Die biblioteek met vaste adapters word tot enkelstringe gedenatureer en aan die vloeisel geënt, gevolg deur brugamplifikasie om trosse te vorm wat klonale DNA-fragmente bevat. Voor opeenvolging splits die biblioteek in enkelstringe met behulp van linearisasie-ensiem [10], en dan sal vier soorte nukleotiede (ddATP, ddGTP, ddCTP, ddTTP) wat verskillende splitsbare fluoresserende kleurstof bevat en 'n verwyderbare blokkeergroep die sjabloon een aanvul. basis op 'n slag, en die sein kan deur 'n (laai-gekoppelde toestel) CCD vasgelê word.

Aanvanklik was solexa GA-uitset 1 G/run. Deur verbeterings in polimerase, buffer, vloeisel en sagteware het die uitset van GA in 2009 toegeneem tot 20 G/lopie in Augustus (75PE), 30 G/loop in Oktober (100PE), en 50 G/loop in Desember (Truseq V3) , 150PE), en die nuutste GAIIx-reeks kan 85 G/lopie bereik. Vroeg in 2010 het Illumina HiSeq 2000 bekendgestel, wat dieselfde volgordebepalingstrategie met GA aanneem, en BGI was van die eerstes wêreldwyd wat die HiSeq-stelsel aangeneem het. Sy uitset was aanvanklik 200 G per lopie, verbeter tot 600 G per lopie tans wat in 8 dae klaargemaak kan word. In die afsienbare toekoms kan dit 1 T/lopie bereik wanneer 'n persoonlike genoomkoste onder $1 K kan daal. Die foutkoers van 100PE kan gemiddeld onder 2% wees na filtering (BGI se data). In vergelyking met 454 en SOLiD, is HiSeq 2000 die goedkoopste in volgordebepaling met .02/miljoen basisse (reagens word slegs deur BGI getel). Met multipleksing ingesluit in P5/P7-primers en adapters, kan dit duisende monsters gelyktydig hanteer. HiSeq 2000 benodig (HiSeq beheer sagteware) HCS vir programbeheer, (intydse ontledersagteware) RTA om op-instrument basisoproepe te doen, en CASAVA vir sekondêre analise. Daar is 'n 3 TB-hardeskyf in HiSeq 2000. Met behulp van Truseq v3-reagense en verwante sagteware het HiSeq 2000 baie verbeter op hoë GC-volgordebepaling. MiSeq, 'n bank-top-volgorder wat in 2011 bekendgestel is en die meeste tegnologieë met HiSeq gedeel het, is veral gerieflik vir amplikon- en bakteriese monstervolgordebepaling. Dit kan 150PE volgorde en genereer 1.5 G/loop in ongeveer 10 uur insluitend monster en biblioteek voorbereiding tyd. Biblioteekvoorbereiding en hul konsentrasiemeting kan albei geoutomatiseer word met versoenbare stelsels soos Agilent Bravo, Hamilton Banadu, Tecan en Appelkoosontwerpe.

4.1. HiSeq sagteware

HiSeq-beheerstelsel (HCS) en intydse analiseerder (RTA) word deur HiSeq 2000 aangeneem. Hierdie twee sagteware kan die aantal en posisie van groepe bereken op grond van hul eerste 20 basisse, so die eerste 20 basisse van elke volgorde sal elke volgorde se volgorde bepaal uitset en kwaliteit. HiSeq 2000 gebruik twee lasers en vier filters om vier tipes nukleotied (A, T, G en C) op te spoor. Die emissiespektra van hierdie vier soorte nukleotiede het kruisspraak, dus is die beelde van vier nukleotiede nie onafhanklik nie en die verspreiding van basisse sal die kwaliteit van volgordebepaling beïnvloed. Die standaard volgorde-afvoerlêers van die HiSeq 2000 bestaan ​​uit *bcl-lêers, wat die basisoproepe en kwaliteittellings in elke siklus bevat. En dan word dit omgeskakel na *_qseq.txt-lêers deur BCL Converter. Die ELAND-program van CASAVA (vanlyn sagteware verskaf deur Illumina) word gebruik om 'n groot aantal leeswerk teen 'n genoom te pas.

Ten slotte, van die drie NGS-stelsels wat voorheen beskryf is, beskik die Illumina HiSeq 2000 oor die grootste uitset en die laagste reagenskoste, die SOLiD-stelsel het die hoogste akkuraatheid [11], en die Roche 454-stelsel het die langste leeslengte. Besonderhede van drie volgordestelsels word in Tabelle 1(a), 1(b) en 1(c) gelys.

5. Kompakte PGM Sequencers

Ion Personal Genome Machine (PGM) en MiSeq is deur Ion Torrent en Illumina bekendgestel. Hulle is albei klein in grootte en het vinnige omsetkoerse, maar beperkte data-deurset. Hulle is gerig op kliniese toepassings en klein laboratoriums.

5.1. Ion PGM van Ion Torrent

Ion PGM is vrygestel deur Ion Torrent aan die einde van 2010. PGM gebruik halfgeleier-volgorde-tegnologie. Wanneer 'n nukleotied deur die polimerase in die DNA-molekules geïnkorporeer word, word 'n proton vrygestel. Deur die verandering in pH op te spoor, het PGM herken of die nukleotied bygevoeg is of nie. Elke keer as die skyfie met een nukleotied na die ander oorstroom is, as dit nie die korrekte nukleotied is nie, sal geen spanning gevind word as daar 2 nukleotiede bygevoeg is nie, daar is dubbelspanning opgespoor [15]. PGM is die eerste kommersiële opeenvolgingsmasjien wat nie fluoressensie en kameraskandering benodig nie, wat lei tot hoër spoed, laer koste en kleiner instrumentgrootte. Tans maak dit 200 bp-lesings in 2 uur moontlik en die monstervoorbereidingstyd is minder as 6 uur vir 8 monsters in parallel.

'n Voorbeeldige toepassing van die Ion Torrent PGM-volgorder is die identifikasie van mikrobiese patogene. In Mei en Junie 2011 het 'n voortdurende uitbraak van buitengewone virulente Shiga-toksien- (Stx)-produserende Escherichia coli O104:H4 gesentreer in Duitsland [16, 17], was daar meer as 3000 mense wat besmet is. Die hele genoomvolgordebepaling op Ion Torrent PGM-volgorder en HiSeq 2000 het die wetenskaplikes gehelp om die tipe E coli wat die leidraad direk sal toepas om die antibiotiese weerstand te vind. Die stam het gelyk of dit 'n baster van twee was E coli stamme—entero aggregatief E coli en entero hemorragies E coli-wat kan help om te verduidelik hoekom dit besonder patogenies was. Van die volgorde resultaat van E coli TY2482 [18], PGM toon die potensiaal om 'n vinnige, maar beperkte deursetvolgorder te hê wanneer daar 'n uitbreek van nuwe siekte is.

Om die volgordekwaliteit, karteringtempo en GC-diepteverspreiding van Ion Torrent te bestudeer en te vergelyk met HiSeq 2000, 'n hoë GC Rhodobacter monster met 'n hoë GC-inhoud (66%) en 4.2 Mb genoom is in hierdie twee verskillende volgordebepalings bepaal (Tabel 2). In 'n ander eksperiment, E coli K12 DH10B (NC_010473.1) met GC 50.78% is deur Ion Torrent gevolgorde vir ontleding van kwaliteit waarde, leeslengte, posisie akkuraatheid en GC verspreiding (Figuur 1).


(a)
(b)
(c)
(a)
(b)
(c) Ion Torrent volgorde kwaliteit. E coli K12 DH10B (NC_010473.1) met GC 50.78% is vir hierdie eksperiment gebruik. (a) is 314–200 bp vanaf Ion Torrent. Die linker figuur is kwaliteit waarde: pienk reeks verteenwoordig kwaliteit minimum en maksimum waardes wat elke posisie het. Groen area verteenwoordig die boonste en onderste kwart (1/4) lees van kwaliteit. Rooi lyn verteenwoordig die gemiddelde kwaliteit waarde in die posisie. Die regte figuur is leeslengte-analise: gekleurde histogram verteenwoordig die werklike leeslengte. Die swart lyn verteenwoordig die gekarteerde lengte, en omdat dit 3′ sagte knip toelaat, verskil die lengte van die werklike leeslengte. (b) is akkuraatheidsanalise. In elke posisie word die akkuraatheidstipe, insluitend wanpassing, invoeging en verwydering, aan die linkerkant gewys

-as. Die gemiddelde akkuraatheid word regs gewys

5.1.1. Opeenvolging kwaliteit

Die kwaliteit van Ion Torrent is meer stabiel, terwyl die kwaliteit van HiSeq 2000 merkbaar afneem na 50 siklusse, wat veroorsaak kan word deur die verval van fluoresserende sein met die verhoging van die leeslengte (getoon in Figuur 1).

5.1.2. Kartering

Die insetgrootte van die biblioteek van Rhodobacter was 350 bp, en 0.5 Gb data is verkry vanaf HiSeq. Die volgorde-diepte was meer as 100x, en die contig en steier N50 was onderskeidelik 39530 bp en 194344 bp. Gebaseer op die samestellingresultaat, het ons 33 Mb gebruik wat verkry word uit ioonstroom met 314 skyfies om die kaarttempo te ontleed. Die belyningsvergelyking is Tabel 2.

Die kaarttempo van Ion Torrent is hoër as HiSeq 2000, maar dit is onvergelykbaar as gevolg van die verskillende belyningsmetodes wat in verskillende volgorders gebruik word. Behalwe vir die beduidende verskil op data, insluitend wanpassingskoers, invoegtempo en uitveetempo, was HiSeq 2000 en Ion Torrent steeds onvergelykbaar as gevolg van die verskillende volgordebepalingsbeginsels. Byvoorbeeld, die polinukleotied-plek kon nie maklik in Ion Torrent geïdentifiseer word nie. Maar dit word getoon dat Ion Torrent 'n stabiele gehalte het met volgorde-lesings en 'n goeie prestasie op wanaanpassing akkuraatheid, maar eerder 'n vooroordeel in die opsporing van indels. Verskillende tipes akkuraatheid word ontleed en in Figuur 1 getoon.

5.1.3. GC-diepteverspreiding

Die GC-diepteverspreiding is beter in Ion Torrent vanaf Figuur 1. In Ion Torrent is die volgorde-diepte soortgelyk, terwyl die GC-inhoud van 63% tot 73% is. In HiSeq 2000 is die gemiddelde volgordebepalingsdiepte egter 4x wanneer die GC-inhoud 60% is, terwyl dit 3x is met 70% GC-inhoud.

Ion Torrent het reeds Ion 314 en 316 vrygestel en beplan om Ion 318-skyfies aan die einde van 2011 bekend te stel. Die skyfies verskil in die aantal putte wat lei tot hoër produksie binne dieselfde volgordetyd. Die Ion 318-skyfie maak die produksie van >1 Gb-data in 2 uur moontlik. Die leeslengte sal na verwagting toeneem tot >400 bp in 2012.

5.2. MiSeq van Illumina

MiSeq wat steeds SBS-tegnologie gebruik, is deur Illumina bekendgestel. Dit integreer die funksies van klustergenerering, SBS en data-analise in 'n enkele instrument en kan binne 'n enkele dag (so min as 8 uur) van monster tot antwoord (ontleed data) gaan. Die Nextera, TruSeq en Illumina se omkeerbare terminator-gebaseerde volgorde deur sintese-chemie is in hierdie innoverende ingenieurswese gebruik. Die hoogste integriteitsdata en breër toepassingsreeks, insluitend amplikonvolgordebepaling, kloonkontrolering, ChIP-Seq, en klein genoomvolgordebepaling, is die uitstaande dele van MiSeq. Dit is ook buigsaam om enkele 36 bp-lesings (120 MB-uitvoer) tot 2 × 150 gepaarde-end-lesings (1–1,5 GB-uitset) in MiSeq uit te voer. As gevolg van die aansienlike verbetering in leeslengte, presteer die resulterende data beter in contig-samestelling in vergelyking met HiSeq (data nie gewys nie). Die verwante volgordebepalingsresultaat van MiSeq word in Tabel 3 getoon. Ons het ook PGM met MiSeq in Tabel 4 vergelyk.

5.3. Voltooi Genomika

Volledige genomika het sy eie opeenvolger gebaseer op Polonator G.007, wat ligasie-gebaseerde opvolger is. Die eienaar van Polonator G.007, Dover, het saamgewerk met die Church Laboratory of Harvard Medical School, wat dieselfde span as SOLiD-stelsel is, en hierdie goedkoop oop stelsel bekendgestel. Die Polonator kan 'n hoëprestasie-instrument teen 'n baie lae prys en die vrylik aflaaibare oopbronsagteware en -protokolle in hierdie volgordestelsel kombineer. Die Polonator G.007 is ligasie opsporing volgordebepaling, wat die basis dekodeer deur die enkel-basis sonde in nie-nukleotiede (nonamers), nie deur dubbel-basis kodering [19]. Die fluorofoor-gemerkte nonamers sal gedegenereer word deur selektief te ligeer op 'n reeks anker-inleiders, waarvan die vier komponente gemerk is met een van vier fluorofore met behulp van T4 DNA-ligase, wat ooreenstem met die basistipe by die navraagposisie. In die afbindingsvordering is T4 DNA-ligase veral sensitief vir wanpassings aan die 3'-kant van die gaping, wat voordelig is om die akkuraatheid van volgordebepaling te verbeter. Na beeldvorming, stroop die Polonator chemies die skikking van uitgegloeide primer-fluoresserende sondekompleks, die anker-primer word vervang en die nuwe mengsel is fluoresserend gemerk, nonamers word ingebring om die aangrensende basis te volgorde [20]. Daar is twee opdaterings in vergelyking met Polonator G.007, DNA nanoball (DNB) skikkings, en kombinatoriese sonde-anker ligasie (cPAL). In vergelyking met DNA-groepering of mikrosfeer, verkry DNA-nanobal-skikkings hoër digtheid van DNA-groepering op die oppervlak van 'n silikonskyfie. Aangesien die sewe 5-basis segmente diskontinu is, het die stelsel van hibridisasie-ligasie-opsporingssiklus 'n hoër foutverdraagsame vermoë in vergelyking met SOLiD. Volledige genomika beweer dat dit 99,999% akkuraatheid met 40x diepte het en kan SNP, indel en CNV analiseer met prys 5500$–9500$. Maar Illumina berig 'n beter prestasie van HiSeq 2000 gebruik slegs 30x data (Illumina Genome Network).Onlangs het sommige navorsers CG se menslike genoomvolgorde-data vergelyk met Illumina-stelsel [21], en daar is noemenswaardige verskille in die opsporing van SNV's, indels en stelselspesifieke opsporings in variante.

5.4. Die Derde Generasie Sequencer

Terwyl die toenemende gebruik en nuwe wysiging in die volgende generasie volgordebepaling, die derde generasie opeenvolging uitkom met nuwe insig in die volgordebepaling. Derdegenerasie-volgordebepaling het twee hoofkenmerke. Eerstens is PCR nie nodig voor volgordebepaling nie, wat die DNA-voorbereidingstyd vir volgordebepaling verkort. Tweedens word die sein in reële tyd vasgelê, wat beteken dat die sein, maak nie saak of dit fluoresserend (Pacbio) of elektriese stroom (Nanopore) is nie, gemonitor word tydens die ensiematiese reaksie van die toevoeging van nukleotied in die komplementêre string.

Enkel-molekule intydse (SMRT) is die derde generasie volgordebepaling metode wat ontwikkel is deur Pacific Bioscience (Menlo Park, CA, VSA), wat gebruik gemaak het van gemodifiseerde ensiem en direkte waarneming van die ensiematiese reaksie in reële tyd. SMRT-sel bestaan ​​uit miljoene nul-modus golfleiers (ZMWs), ingebed met slegs een stel ensieme en DNA-sjabloon wat tydens die hele proses opgespoor kan word. Tydens die reaksie sal die ensiem die nukleotied in die komplementêre string inkorporeer en die fluoresserende kleurstof wat voorheen aan die nukleotied gekoppel is, afsplit. Dan sal die kamera binne die masjien sein in 'n filmformaat in intydse waarneming vasvang [19]. Dit sal nie net die fluoresserende sein gee nie, maar ook die seinverskil oor tyd, wat nuttig kan wees vir die voorspelling van strukturele variansie in die volgorde, veral nuttig in epigenetiese studies soos DNA-metiliering [22].

In vergelyking met die tweede generasie, het PacBio RS (die eerste sequencer wat deur PacBio bekendgestel is) verskeie voordele. Eerstens is die monstervoorbereiding baie vinnig dit neem 4 tot 6 uur in plaas van dae. Dit het ook nie PCR-stap in die voorbereidingstap nodig nie, wat vooroordeel en foute wat deur PCR veroorsaak word, verminder. Tweedens, die omsetkoers is redelik vinnig lopies word binne 'n dag voltooi. Derdens is die gemiddelde leeslengte 1300 bp, wat langer is as dié van enige tweedegenerasie-volgordetegnologie. Alhoewel die deurset van die PacBioRS laer is as die tweede generasie sekwenser, is hierdie tegnologie baie nuttig vir kliniese laboratoriums, veral vir mikrobiologie navorsing. 'n Referaat is gepubliseer met behulp van PacBio RS oor die Haïtiaanse cholera-uitbraak [19].

Ons het 'n De novo samestelling van DNA-fosmiedmonster van Oyster met PacBio RS in standaardvolgordebepalingsmodus (met behulp van LPR-chemie en SMRT-selle in plaas van die nuwe weergawe FCR-chemie en SMRT-selle). 'n SMRT-bandsjabloon met 'n gemiddelde insetgrootte van 7500 kb word gemaak en in een SMRT-sel uitgevoer en 'n 120-minute film word geneem. Na Post-QC-filter is 22,373,400 bp-lesings in 6754-lesings (gemiddeld 2,566 bp) gerangskik met die gemiddelde leestelling van 0,819. Die dekking is 324x met 'n gemiddelde leestelling van 0,861 en hoë akkuraatheid (

99,95). Die resultaat word in Figuur 2 vertoon.


Volgordebepaling van 'n fosmied-DNS met behulp van Pacific Biosciences-volgorder. Met dekking kan die akkuraatheid bo 97% wees. Die figuur is gekonstrueer deur BGI se eie data.

Nanopore-volgordebepaling is 'n ander metode van die derde generasie volgordebepaling. Nanopore is 'n piepklein bioporie met deursnee in nanoskaal [23], wat gevind kan word in proteïenkanaal ingebed op lipied dubbellaag wat ioonuitruiling vergemaklik. As gevolg van die biologiese rol van nanopore, kan enige deeltjiebeweging die spanning oor die kanaal ontwrig. Die kernkonsep van nanopore-volgordebepaling behels om 'n draad van enkelstring-DNS oor te plaas α-hemolisien (αHL) porie. αHL, 'n 33 kD proteïen geïsoleer uit Staphylococcus aureus [20], ondergaan selfsamestelling om 'n heptameriese transmembraankanaal te vorm [23]. Dit kan buitengewone spanning tot 100 mV verdra met stroom 100 pA [20]. Hierdie unieke eiendom ondersteun sy rol as bousteen van nanopore. In nanopore-volgordebepaling word 'n ioniese vloei voortdurend toegepas. Huidige ontwrigting word eenvoudig deur standaard elektrofisiologiese tegniek opgespoor. Uitlees word staatgemaak op die grootteverskil tussen alle deoksiribonukleosiedmonofosfaat (dNMP). Dus, vir gegewe dNMP, word kenmerkende stroommodulasie getoon vir diskriminasie. Ioniese stroom word hervat nadat vasgevangde nukleotied heeltemal uitgedruk het.

Nanopore-volgordebepaling het 'n aantal vrugbare voordele bo bestaande gekommersialiseerde volgende-generasie volgordebepalingtegnologieë. Eerstens bereik dit potensieel lang leeslengte >5 kbp met spoed 1 bp/ns [19]. Boonop is die opsporing van basisse fluoresserende merkervry. Derdens, behalwe die gebruik van eksonuklease om ssDNA en nukleotiedsplitsing op te hou [24], word die betrokkenheid van ensiem merkwaardig uit die weg geruim in nanopore-volgordebepaling [22]. Dit impliseer dat nanopore-volgordebepaling minder sensitief is vir temperatuur regdeur die volgordebepalingsreaksie en betroubare uitkoms gehandhaaf kan word. Vierdens, in plaas van die volgorde van DNA tydens polimerisasie, word enkel DNA-stringe deur middel van DNA-string depolimerisasie deur nanopore georden. Gevolglik kan inhandigingstyd vir monstervoorbereiding soos kloning en amplifikasiestappe aansienlik verkort word.

6. Bespreking van NGS Aansoeke

Vinnige vordering in DNA-volgordebepalingstegnologie het tot 'n aansienlike vermindering in koste en 'n aansienlike toename in deurset en akkuraatheid gelei. Met meer en meer organismes wat opeenvolgend is, oorstroom 'n vloed van genetiese data die wêreld elke dag. Vooruitgang in genomika het geleidelik vorentoe beweeg as gevolg van 'n omwenteling in volgordebepalingtegnologie. Daarbenewens word ander tipes grootskaalse studies in eksomika, metagenomika, epigenomika en transkriptomika almal werklikheid. Hierdie studies verskaf nie net die kennis vir basiese navorsing nie, maar bied ook onmiddellike toepassingsvoordele. Wetenskaplikes oor baie velde gebruik hierdie data vir die ontwikkeling van beter florerende gewasse en oesopbrengste en vee en verbeterde diagnostiek, voorspellings en terapieë vir kanker en ander komplekse siektes.

BGI is op die voorpunt van die vertaling van genomika-navorsing in molekulêre teling- en siekteassosiasiestudies met die oortuiging dat landbou, medisyne, geneesmiddelontwikkeling en kliniese behandeling uiteindelik 'n nuwe stadium sal betree vir meer gedetailleerde begrip van die genetiese komponente van al die organismes. BGI is hoofsaaklik gefokus op drie projekte. (1) Die Miljoen Spesies/Variëteite Genome-projek het ten doel om 'n miljoen ekonomies en wetenskaplik belangrike plante, diere en modelorganismes, insluitend verskillende rasse, variëteite en stamme, te volgorde. Hierdie projek word die beste verteenwoordig deur ons volgordebepaling van die genome van die reuse-panda, aartappel, macaca en ander, tesame met veelvuldige hervolgorde-projekte. (2) Die Miljoen Menslike Genome-projek fokus op grootskaalse populasie- en assosiasiestudies wat heelgenoom- of heeleksoomvolgordebepalingstrategieë gebruik. (3) Die Million Eco-System Genomes Project het die doel om die metagenoom en gekweekte mikrobioom van verskeie verskillende omgewings, insluitend mikro-omgewings binne die menslike liggaam, in volgorde te bepaal [25]. Saam word hulle 3 M-projek genoem.

In die volgende deel, elk van die volgende aspekte van aansoeke, insluitend De novo volgordebepaling, maat-paar, heel genoom of teikengebied hervolgordebepaling, klein RNA, transkriptome, RNA seq, epigenomics en metagenomics, word kortliks opgesom.

In DNA De novo volgordebepaling, word die biblioteek met insetselgrootte onder 800 bp gedefinieer as DNA-kortfragmentbiblioteek, en dit word gewoonlik toegepas in De novo en hervolgorde van navorsing. Skovgaard et al. [26] het 'n kombinasiemetode van WGS (heelgenoomvolgordebepaling) en genoomkopiegetalanalise toegepas om die mutasies te identifiseer wat die groeitekort wat deur oormatige inisiasies van die E coli oorsprong van replikasie, oriC.

Mate-paar biblioteek volgordebepaling is aansienlik voordelig vir De novo volgordebepaling, omdat die metode gapingsgebied kan verklein en steierlengte kan verleng. Reinhardt et al. [27] 'n nuwe metode ontwikkel vir De novo genoomsamestelling deur volgordebepalingsdata van hoë-deurset-kortleesvolgorde-tegnologie te analiseer. Hulle het genome in groot steiers saamgestel teen 'n fraksie van die tradisionele koste en sonder om verwysingsvolgorde te gebruik. Die samestelling van een monster het 'n N50-steiergrootte van 531,821 bp opgelewer met >75% van die voorspelde genoom wat deur steiers meer as 100,000 bp gedek is.

Heelgenoomhervolgordebepaling het die volledige DNS-volgorde van 'n organisme se genoom ingesluit, insluitend die hele chromosomale DNS op 'n enkele tyd en belyning met die verwysingsvolgorde. Mills et al. [28] het 'n kaart van ongebalanseerde SV's (genomiese strukturele variante) gebou op grond van heelgenoom DNA-volgordedata van 185 menslike genome met SOLiD-platform, die kaart het 22 025 delesies en 6 000 bykomende SV's ingesluit, insluitend invoegings en tandem duplisering [28]. Die meeste SV's (53%) is gekarteer na nukleotiedresolusie, wat die ontleding van hul oorsprong en funksionele impak vergemaklik het [28].

Die hele genoomherrangskikking is 'n effektiewe manier om die funksionele geen te bestudeer, maar die hoë koste en massiewe data is die grootste probleem vir die meeste navorsers. Teikenstreek-volgordebepaling is 'n oplossing om dit op te los. Mikroskikking vang is 'n gewilde manier van teikengebied-volgordebepaling, wat hibridisasie gebruik met skikkings wat sintetiese oligonukleotiede bevat wat ooreenstem met die teiken-DNS-volgordebepaling. Gnirke et al. [29] het 'n vasgelê metode ontwikkel wat 'n RNA "aas" gebruik om teiken DNS fragmente van die "dam" vas te vang en dan die Illumina platform gebruik om die volgorde uit te lees. Ongeveer 90% van uniek belynde basisse het op of naby lokaasvolgorde geval, tot 50% het op eksons gelê [29].

Fehniger et al. het twee platforms, Illumina GA en ABI SOLiD, gebruik om die miRNA-transkriptome van rustende en sitokien-geaktiveerde primêre muriene NK (natuurlike moordenaar) selle te definieer [30]. Die geïdentifiseerde 302 bekende en 21 nuwe volwasse miRNA's is geanaliseer deur 'n unieke bioinformatika-pyplyn vanaf klein RNA-biblioteke van NK-sel. Hierdie miRNA's word in 'n wye reeks ooruitgedruk en vertoon isomiR-kompleksiteit, en 'n subset word differensieel uitgedruk na sitokienaktivering, wat die leidraad was om die identifikasie van miRNA's deur die Illumina GA en SOLiD-instrumente te identifiseer [30].

Die transkriptoom is die stel van alle RNA-molekules, insluitend mRNA, rRNA, tRNA en ander niekoderende RNA wat in een of 'n populasie van selle geproduseer word. In hierdie jare word die volgende generasie volgordebepalingtegnologie gebruik om die transkripsie te bestudeer, vergelyk met DNA-mikroskikkingstegnologie in die verlede. Die S. mediterranea transkriptoom kan opeenvolging gemaak word deur 'n doeltreffende volgordebepalingstrategie wat ontwerp is deur Adamidi et al. [31]. Die katalogus van saamgestelde transkripsies en die geïdentifiseerde peptiede in hierdie studie brei en verfyn planêre geenannotasie dramaties uit, wat gedemonstreer word deur validering van verskeie voorheen onbekende transkripsies met stamsel-afhanklike uitdrukkingspatrone.

RNA-seq is 'n nuwe metode in RNA-volgordebepaling om mRNA-uitdrukking te bestudeer. Dit is soortgelyk aan transkriptoomvolgordebepaling in monstervoorbereiding, behalwe die ensiem. Om die tegniese variansie te skat, het Marioni et al. [32] het 'n nier-RNA-monsters op beide Illumina-platform en Affymetrix-skikkings ontleed. Die bykomende ontledings soos lae-uitgedrukte gene, alternatiewe splitsingsvariante en nuwe transkripsies is op Illumina-platform gevind. Bradford et al. [33] het die data van RNA-seq biblioteek op die SOLiD platform en Affymetrix Exon 1.0ST skikkings vergelyk en 'n hoë mate van ooreenstemming tussen die twee platforms gevind in terme van eksonvlak vou veranderinge en opsporing. En die grootste opsporingskorrespondensie is gesien wanneer die agtergrondfoutkoers uiters laag is in RNA-volgens. Die verskil tussen RNA-seq en transkriptoom op SOLiD is nie so duidelik soos Illumina nie.

Daar is twee soorte toepassings van epigenetiese, Chromatien-immunopresipitasie en metileringsanalise. Chromatien-immunopresipitasie (ChIP) is 'n immunopresipitasietegniek wat gebruik word om die interaksie tussen proteïen en DNA in 'n sel te bestudeer, en die histoon-modifikasies sal gevind word deur die spesifieke ligging in genoom. Gebaseer op die volgende generasie volgordebepaling tegnologie, Johnson et al. [34] het 'n grootskaalse chromatien-immunopresipitasie-toets ontwikkel om motief te identifiseer, veral nie-kanoniese NRSF-bindende motief. Die data vertoon skerp resolusie van bindingsposisie (±50 bp), wat belangrik is om nuwe kandidaat-interaksie af te lei vir die hoë sensitiwiteit en spesifisiteit (ROC (ontvanger operateur kenmerk) area ≥0.96) en statistiese vertroue (

< 10–4). Nog 'n belangrike toepassing in epigenetiese is DNA-metileringsanalise. DNS-metilering bestaan ​​tipies in vertebrate by CpG-plekke, die metilering het die omskakeling van die sitosien na 5-metielsitosien veroorsaak. Chung het 'n hele metieloom-volgordebepaling aangebied om die verskil tussen twee soorte bisulfiet-omskakelingsmetodes (in oplossing teenoor in gel) deur SOLiD-platform [35] te bestudeer.

Die wêreldklas genoomprojekte sluit die 1000 genoomprojek in, en die menslike ENCODE-projek, die menslike mikrobioom (HMP)-projek, om 'n paar te noem. BGI neem 'n aktiewe rol in hierdie en vele meer deurlopende projekte soos 1000 Diere- en Plantgenoomprojek, die MetaHIT-projek, Yanhuang-projek, LUCAMP (Diabetes-geassosieerde Gene en Variasies Studie), ICGC (internasionale kankergenoomprojek), Antieke menslike genoom, 1000 Mendelian Disorders Project, Genome 10 K Project, ensovoorts [25]. Hierdie internasionaal saamgewerkte genoomprojekte het genomikastudie en toepassings in gesondheidsorg en ander velde aansienlik verbeter.

Om veelvuldige projekte te bestuur, insluitend groot en komplekse projekte met tot tienduisende monsters, word 'n voortreflike en gesofistikeerde projekbestuurstelsel vereis wat inligtingverwerking hanteer vanaf die begin van monsteretikettering en berging tot biblioteekkonstruksie, multipleksing, volgordebepaling en informatika-analise. . Navorsingsgeoriënteerde bioinformatika-analise en opvolgeksperiment verwerk is nie ingesluit nie. Alhoewel die aanvaarding van outomatiseringstegnieke bio-eksperiment menslike inmenging aansienlik vereenvoudig het, moet alle ander prosedures wat deur menslike krag uitgevoer word, bestuur word. BGI het BMS-stelsel en Wolkdiens ontwikkel vir doeltreffende inligting-uitruiling en projekbestuur. Die gedragsbestuur volg hoofsaaklik Japan 5S ter plaatse model. Daarbenewens het BGI ISO9001 en CSPro (gemagtig deur Illumina) QC-stelsel geslaag en neem tans (Kliniese Laboratoriumverbeteringswysigings) CLIA en (American Society for Histocompatibility and Immunogenetics) AShI-toetse. Vinnige, standaard en oop weerkaatsingstelsel waarborg 'n doeltreffende probleemoplossingsroete en hoë werkverrigting, byvoorbeeld, instrumentontwerpmislukking van Truseq v3-vloeisel wat lei tot borrelvoorkoms (wat deur Illumina gedefinieer word as "onder-middel-swatch"-verskynsel) en ewekansig

in lees. Dit benadeel potensieel volgordekwaliteit, GC-samestelling sowel as deurset. Dit beïnvloed nie net 'n klein area waar die borrel opspoor nie, wat lei tot lees

maar beïnvloed ook die fokus van die plek naby, insluitend die hele monster, en die aangrensende monster. Filterparameters moet bepaal word om kwaliteit rou data vir bioinformatika verwerking te verseker. Onder leiding van die NGS-tegnologiegroep is gesamentlike vergaderings belê vir die ontleding en probleemoplossing van hierdie probleem, om strategieë te bespreek om die effek ten opsigte van koste en projektyd die beste te verminder, om kommunikasiekanaal te bou, om vergoeding statisties op te som, ten einde die beste projekbestuur te verskaf. strategieë in hierdie tyd. Sommige reagens QC voorbeelde word opgesom in Liu et al. [36].

BGI vestig hul wolkdienste. Gekombineer met gevorderde NGS-tegnologieë met veelvuldige keuses, is 'n prop-en-loop-informatikadiens handig en bekostigbaar. 'n Reeks sagteware is beskikbaar, insluitend BLAST, SOAP en SOAP SNP vir volgordebelyning en pyplyne vir RNAseq-data. Ook SNP-oproepprogramme soos Hecate en Gaea is op die punt om vrygestel te word. Grootdata-studies van die hele spektrum van lewens- en biomediese wetenskappe kan nou gedeel en gepubliseer word in 'n nuwe joernaal GigaSicence wat saamgestig is deur BGI en Biomed Central. Dit het 'n nuwe publikasieformaat: elke stukkie data skakel na 'n standaard manuskrippublikasie met 'n uitgebreide databasis wat alle geassosieerde data, data-analise-instrumente en wolkrekenaarhulpbronne huisves. Die omvang dek nie net omiese tipe data en die velde van hoë-deursetbiologie wat tans deur groot openbare bewaarplekke bedien word nie, maar ook die groeiende reeks moeiliker-toeganklike data, soos beeldvorming, neurowetenskap, ekologie, kohortdata, stelselbiologie, en ander nuwe tipes grootskaalse deelbare data.

Verwysings

  1. G. M. Church en W. Gilbert, "Genomiese volgordebepaling," Verrigtinge van die Nasionale Akademie van Wetenskappe van die Verenigde State van Amerika, vol. 81, nr. 7, pp. 1991–1995, 1984. Kyk by: Google Scholar.
  2. F.S. Collins, M. Morgan en A. Patrinos, "Die Menslike Genoomprojek: lesse uit grootskaalse biologie," Wetenskap, vol. 300, nr. 5617, pp. 286–290, 2003. Kyk by: Publisher Site | Google Scholar. .
  3. J. Berka, Y. J. Chen, J. H. Leamon et al., "Bead emulsion nucleic acid amplification," Amerikaanse patentaansoek, 2005. Kyk by: Google Scholar
  4. T. Foehlich et al., "Hoë-deurset nukleïensuuranalise," Amerikaanse patent, 2010. Kyk by: Google Scholar. .
  5. E. R. Mardis, "Die impak van die volgende generasie volgordebepaling tegnologie op genetika," Tendense in genetika, vol. 24, nr. 3, pp. 133–141, 2008. Kyk by: Publisher Site | Google Scholar
  6. S. M. Huse, J. A. Huber, H. G. Morrison, M. L. Sogin, en D. M. Welch, "Akkuraatheid en kwaliteit van massief parallelle DNA-pyrosequencing," Genoom Biologie, vol. 8, nr. 7, artikel R143, 2007. Kyk by: Publisher Site | Google Scholar
  7. "Die nuwe GS junior sequencer," http://www.gsjunior.com/instrument-workflow.php. Kyk by: Google Scholar
  8. "SOLiD stelsel akkuraatheid," http://www.appliedbiosystems.com/absite/us/en/home/applications-technologies/solid-next-generation-sequencing.html. Kyk by: Google Scholar.
  9. B. A. Flusberg, D. R. Webster, J. H. Lee et al., "Direkte opsporing van DNA-metilering tydens enkel-molekule, intydse volgordebepaling," Natuur Metodes, vol. 7, nr. 6, pp. 461–465, 2010.Kyk by: Publisher Site | Google Scholar
  10. A. Mellmann, D. Harmsen, C. A. Cummings et al., "Voornemende genomiese karakterisering van die Duitse enterohemorragiese Escherichia coli O104:H4-uitbraak deur vinnige volgende generasie volgordebepalingstegnologie," PLoS EEN, vol. 6, nr. 7, Artikel ID e22751, 2011. Kyk by: Publisher Site | Google Scholar
  11. H. Rohde, J. Qin, Y. Cui et al., "Oopbron genomiese analise van Shiga-toksien-produserende E. coli O104:H4," New England Journal of Medicine, vol. 365, nr. 8, pp. 718–724, 2011. Kyk by: Google Scholar
  12. C. S. Chin, J. Sorenson, J. B. Harris et al., "Die oorsprong van die Haïtiaanse cholera-uitbraak-stam," New England Journal of Medicine, vol. 364, nr. 1, pp. 33–42, 2011. Kyk by: Publisher Site | Google Scholar
  13. W. Timp, U. M. Mirsaidov, D. Wang, J. Comer, A. Aksimentiev en G. Timp, "Nanopore-volgordebepaling: elektriese metings van die lewenskode." IEEE Transaksies op Nanotegnologie, vol. 9, nr. 3, pp. 281–294, 2010. Kyk by: Publisher Site | Google Scholar
  14. D. W. Deamer en M. Akeson, "Nanopore en nukleïensure: vooruitsigte vir ultravinnige volgordebepaling," Tendense in Biotegnologie, vol. 18, nr. 4, pp. 147–151, 2000. Kyk by: Publisher Site | Google Scholar
  15. "Prestasie-vergelyking van heel-genoom-volgordestelsels," Natuur Biotegnologie, vol. 30, pp. 78–82, 2012. Kyk by: Google Scholar
  16. D. Branton, D. W. Deamer, A. Marziali et al., "Die potensiaal en uitdagings van nanopore-volgordebepaling," Natuur Biotegnologie, vol. 26, nr. 10, pp. 1146–1153, 2008. Kyk by: Google Scholar
  17. L. Song, M. R. Hobaugh, C. Shustak, S. Cheley, H. Bayley, en J. E. Gouaux, "Struktuur van stafilokokke α-hemolisien, 'n heptameriese transmembraanporie," Wetenskap, vol. 274, nr. 5294, pp. 1859–1866, 1996. Kyk by: Publisher Site | Google Scholar
  18. J. Clarke, H. C. Wu, L. Jayasinghe, A. Patel, S. Reid en H. Bayley, "Deurlopende basis-identifikasie vir enkel-molekule nanopore DNA-volgordebepaling," Natuur Nanotegnologie, vol. 4, nr. 4, pp. 265–270, 2009. Kyk by: Publisher Site | Google Scholar
  19. Webwerf van BGI, http://www.genomics.org.cn.
  20. O. Skovgaard, M. Bak, A. Lྋner-Olesen et al., "Genomewye opsporing van chromosomale herrangskikkings, indels en mutasies in sirkelvormige chromosome deur kortleesvolgordebepaling," Genoomnavorsing, vol. 21, nr. 8, pp. 1388–1393, 2011. Kyk by: Google Scholar
  21. J. A. Reinhardt, D. A. Baltrus, M. T. Nishimura, W. R. Jeck, C. D. Jones en J. L. Dangl, “De novo samestelling met behulp van lae-dekking kortlees volgorde data van die ryspatogeen Pseudomonas syringae pv. oryzae,” Genoomnavorsing, vol. 19, nr. 2, pp. 294–305, 2009. Kyk by: Publisher Site | Google Scholar
  22. R.E. Mills, K. Walter, C. Stewart et al., "Mapping kopiegetalvariasie deur populasieskaal genoomvolgordebepaling," Natuur, vol. 470, nr. 7332, pp. 59–65, 2011. Kyk by: Publisher Site | Google Scholar
  23. A. Gnirke, A. Melnikov, J. Maguire et al., "Oplossingsbaster seleksie met ultra-lang oligonukleotiede vir massiewe parallelle geteikende volgordebepaling," Natuur Biotegnologie, vol. 27, nr. 2, pp. 182–189, 2009. Kyk by: Publisher Site | Google Scholar
  24. T. A. Fehniger, T. Wylie, E. Germino et al., "Volgende-generasie volgordebepaling identifiseer die natuurlike moordenaarsel mikroRNA-transkriptoom," Genoomnavorsing, vol. 20, nr. 11, pp. 1590–1604, 2010. Kyk by: Publisher Site | Google Scholar
  25. C. Adamidi, Y. Wang, D. Gruen et al., "De novo samestelling en validering van planaria-transkriptoom deur massiewe parallelle volgordebepaling en haelgeweer-proteomika," Genoomnavorsing, vol. 21, nr. 7, pp. 1193–1200, 2011. Kyk by: Publisher Site | Google Scholar
  26. J. C. Marioni, C. E. Mason, S. M. Mane, M. Stephens, en Y. Gilad, "RNA-seq: 'n assessering van tegniese reproduseerbaarheid en vergelyking met geen-uitdrukking skikkings," Genoomnavorsing, vol. 18, nr. 9, pp. 1509–1517, 2008. Kyk by: Publisher Site | Google Scholar
  27. J.R. Bradford, Y. Hey, T. Yates, Y. Li, S.D. Pepper en C.J. Miller, "'n Vergelyking van massiewe parallelle nukleotiedvolgordebepaling met oligonukleotiedmikroskikkings vir globale transkripsieprofilering," BMC Genomics, vol. 11, nr. 1, artikel 282, 2010. Kyk by: Publisher Site | Google Scholar
  28. D.S. Johnson, A. Mortazavi, R.M. Myers en B. Wold, "Genomewye kartering van in vivo proteïen-DNA-interaksies," Wetenskap, vol. 316, nr. 5830, pp. 1497–1502, 2007. Kyk by: Publisher Site | Google Scholar
  29. H. Gu, Z. D. Smith, C. Bock, P. Boyle, A. Gnirke, en A. Meissner, "Voorbereiding van verminderde verteenwoordiging bisulfiet volgordebepaling biblioteke vir genoom-skaal DNA-metilering profilering," Natuur Protokolle, vol. 6, nr. 4, pp. 468–481, 2011. Kyk by: Publisher Site | Google Scholar
  30. L. Liu, N. Hu, B. Wang et al., "'n Kort gebruiksverslag oor die Illumina HiSeq 2000-volgorder," Mikologie, vol. 2, nr. 3, pp. 169–191, 2011. Kyk by: Google Scholar

Kopiereg

Kopiereg © 2012 Lin Liu et al. Hierdie is 'n ooptoegangartikel wat onder die Creative Commons Erkenningslisensie versprei word, wat onbeperkte gebruik, verspreiding en reproduksie in enige medium toelaat, mits die oorspronklike werk behoorlik aangehaal word.


Wat is volgende generasie volgordebepaling?

Kortom, presies dieselfde ding. Oorweeg hierdie definisie:

"Volgende-generasie volgordebepaling verwys na nie-Sanger-gebaseerde hoë-deurset DNA-volgorde-tegnologieë. Miljoene of biljoene DNA-stringe kan parallel georden word, wat aansienlik meer deurset lewer en die behoefte aan die fragmentkloningmetodes wat dikwels in Sanger-volgordebepaling van genome."
&ndash Nature.com

Die twee terme word uitruilbaar gebruik. Histories is Next Generation Sequencing gebruik as die opvangterm vir hoë-deurset DNA-volgordebepaling. Oor die afgelope paar jaar het die term MPS egter wyer aangeneem onder forensiese wetenskaplikes.


Ioon-halfgeleier-volgordebepaling (Ion Torrent-volgordebepaling)

Anders as Illumina en 454, maak Ion-torrent en Ion-proton-volgordebepaling nie gebruik van optiese seine nie. In plaas daarvan ontgin hulle die feit dat byvoeging van 'n dNTP tot 'n DNA-polimeer 'n H+-ioon vrystel.

Die DNA-monster om te volgorde word in fragmente opgesny. Adapters word gebruik om enkele molekules templaat op mikrokrale vas te vang deur middel van primer hibridisasie. Krale word in 'n noukeurig beheerde emulsie geïnkorporeer, waarin elke borrel 'n mikroreaktor uitmaak wat DNA-sjabloon, primer en reagense vir PCR bevat. Na amplifikasie word elke kraal bedek met klonaal geamplifiseerde molekules.

Elke kraal vloei oor 'n skyfie en word in 'n put neergesit. Die skyfie is oorstroom met een van die vier dNTP. Wanneer 'n nukleotied in 'n enkele DNA-string geïnkorporeer word, word 'n waterstofioon vrygestel. Die Ion Torrent-stelsel lees hierdie chemiese verandering direk op die skyfie deur die pH-variasies van die oplossing in die put te volg. 'n Ioon-sensitiewe laag onder die put meet die verandering in pH en skakel dit om na spanning. Hierdie spanningsverandering word aangeteken wat aandui dat die nukleotied geïnkorporeer is en die basis genoem is. Die spanning wat aangeteken is, is eweredig aan die hoeveelheid H+ wat vrygestel word. Die proses word elke siklus herhaal met 'n ander nukleotied wat oor die skyfie spoel.

  • Die ondervraging van meer as 100 gene op 'n slag koste effektief
  • Om nuwe variante te vind deur die aantal teikens wat in 'n enkele lopie gerangskik is uit te brei.
  • Volgordebepaling van monsters wat lae insethoeveelhede beginmateriaal het, deur byvoorbeeld Ion AmpliSeq-biblioteekvoorbereiding te gebruik, wat so min as 10 ng inset-DNA vereis
  • Volgordebepaling van mikrobiese genome vir patogeensubtipering om navorsing van kritieke uitbrekingsituasies moontlik te maak

Die Sanger-metode van DNA-volgordebepaling (Let daarop dat daar om 0:30 'n fout is, die primer gloei aan die 3'-kant van die DNA, nie die 5' soos dit in die video aangedui word nie, want polimerase voeg nukleotied by die 3' einde van 'n DNA-string)


Kyk die video: Parents Who Instantly Regretted Having A Baby - Part 1 (Oktober 2022).