Inligting

Watter inligting dra mikroskikking beeld oor?

Watter inligting dra mikroskikking beeld oor?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

OK, ek het gelees dat 'n sel 4 soorte digitale (om presies diskrete te wees) data genereer, naamlik DNA, RNA, Proteïen (sekwensies wat as stringreekse van nukleotiede/aminosure geënkodeer kan word) en mikro-skikking beeld. Ek is nie 'n bioloog nie, maar my belangstelling is in die statistieke en inligtingsteorie van hierdie data. Ek wil graag weet watter inligting dra DNA mikro-skikking beelde oor? Watter soort inligting verkry ons byvoorbeeld nadat ons dit met behulp van 'n geskikte sagteware verwerk het?

Voorbeeld van mikro-skikking beeld:


Elke kol oorvleuel met 'n oligonukleotied ondersoek, wat ontwerp is om 'n spesifieke nukleïensuurvolgorde te identifiseer. Geenuitdrukking-skikkings het probes wat aanvullend is tot volgordes wat van die eksons afgelei is; daarom sal hulle met hierdie rye hibridiseer.

Voor hibridisering word die cDNA (in hierdie geval) gemerk met 'n fluoresserende molekule soos Cy3 of Cy5 (twee kleurstowwe kan gebruik word om behandel en beheer te onderskei). Let daarop dat elke kol baie sondemolekules sal hê. Fluorescerende intensiteit is eweredig aan die aantal gehybridiseerde DNA-stringe, wat op sy beurt eweredig is aan die uitdrukking daarvan in die monster.

Uitgebreide hoeveelheid tekste is beskikbaar op mikroskikking data-analise wat u redelik maklik kan vind.


Wat jy moet weet voordat jy chromosomale mikroskikking bestel

Chromosomale mikroskikking (CMA) toetsing kan 'n kragtige diagnostiese hulpmiddel wees wanneer dit gepas gebruik word. Die CMA-tegnologie en toetsproses kan verskil van ander laboratoriumtoetse waaraan jy gewoond is, maar met aandag aan die stappe wat in hierdie program uiteengesit word, kan jy hierdie toets suksesvol in jou praktyk toepas. In hierdie afdeling bespreek ons ​​die agtergrondkennis wat u benodig wanneer u besluit of u chromosomale mikroskikking moet bestel, insluitend hoe die toets werk, wat dit opspoor en wanneer dit nuttig bewys is. Hieronder is sleutelvrae wat u moet verstaan ​​voordat u besluit om met chromosomale mikroskikking te toets.

Wat bespeur chromosomale mikroskikking?

Chromosomale mikroskikking (CMA)-toetsing soek ekstra (gedupliseerde) of ontbrekende (geskrap) chromosomale segmente, soms genoem kopiegetalvariante (CNV's). Dit sluit in:

  • Mikrodelesies en mikroduplikasies van chromosoomsegmente, wat te klein is om onder 'n mikroskoop te sien, maar veelvuldige gene kan bevat (sien illustrasie hieronder)
  • Die meeste abnormaliteite van chromosoomgetal (trisomie, monosomie, ens.), insluitend Downsindroom
  • Mees ongebalanseerde herrangskikkings van chromosoomstruktuur (translokasies, ens.)

Afhangende van die platform, kan CMA ook opspoor:

  • Oormatige homosigositeit, wat dui op risiko vir resessiewe siektes of afdrukafwykings (sien Pas resultate toe vir meer inligting)
  • Triploïdie en ander duplisering van die hele chromosoomstel (tetraploïdie, ens.)

Soos met tradisionele kariotipe, kan mosaïekisme ('n mengsel van normale en abnormale selle) van meer as 20-25% deur CMA-toetsing opgespoor word. Opsporingsyfers verskil met die spesifieke toetsplatform ms).

Wat doen CMA nie bespeur?

Geen toets kan alle genetiese siektes uitsluit nie. Sommige tipes variante vereis 'n ander toets, en sommige streke is tegnies moeilik om te isoleer en te ontleed.

  • Klein veranderinge in die volgorde van enkele gene (puntmutasies)
  • Klein dupliserings en delesies van DNS-segmente binne 'n enkele geen (Brose X-sindroom, byvoorbeeld)
  • Gebalanseerde chromosomale herrangskikkings (gebalanseerde translokasies, inversies)

Die beperkings van CMA-toetsing verskil ook met die metodologie wat gebruik word. Die meeste CMA kan nie mosaïek onder 20-25% opspoor nie. Sommige platforms bespeur nie oormatige homosigositeit of triploïdie sowel as ander nie. (Sien die afdeling oor Bestelling vir meer inligting oor die verskillende CMA-platforms.)

Hoe werk CMA?

&ldquoMicroarray&rdquo verwys na 'n mikroskyfie-gebaseerde toetsplatform wat hoëvolume, outomatiese ontleding van baie stukke DNA gelyktydig moontlik maak. CMA-skyfies gebruik etikette of probes wat aan spesifieke chromosoomstreke bind. Rekenaaranalise word gebruik om 'n pasiënt se genetiese materiaal met dié van 'n verwysingsmonster te vergelyk. 'n Verskil tussen 'n pasiënt se DNA en die verwysingsmonster word 'n variant genoem.

Watter pasiënte kan daarby baat vind?

CMA is duidelik nuttig vir individue wat nie 'n spesifieke bekende sindroom (soos Down-sindroom) pas nie, maar enige van die volgende demonstreer:

    Ontwikkelingsagterstand/intellektuele gestremdheid
  • Outisme spektrum versteurings
  • Veelvuldige aangebore anomalieë, insluitend dismorfiese gelaatstrekke

CMA kan ook die mees koste-effektiewe toets wees wanneer jou differensiaal meer as een toestand insluit wat deur die tegnologie opgespoor kan word. Dit is moontlik vir pasiënte om meer as een genetiese toestand te hê, en dit kan oorweeg word as 'n pasiënt kenmerke toon wat nie tipies verband hou met 'n gevestigde diagnose nie. ’n Genetiese spesialis kan help om te bepaal of bykomende toetse, soos CMA, nuttig sal wees.

CMA word ondersoek vir gebruik in ander pasiëntpopulasies, en die gebruike daarvan sal mettertyd uitbrei. In hierdie gevalle kan dit veral nuttig wees wanneer ander toetse nie 'n diagnose kon oplewer nie:

  • Onverklaarbare aanvalle versteuring
  • Groei vertraging
  • Psigiatriese siekte
  • Neuromuskulêre toestande

Hoe word resultate klinies gebruik?

CMA-toetsing kan 'n poort wees om meer hulp te kry vir gesinne van kinders met voorheen ongediagnoseerde toestande. 'n Variant wat op CMA gevind word, kan nie net 'n langverwagte verduideliking vir 'n pasiënt se kliniese bevindings verskaf nie, maar kan ook die bestuur op die volgende maniere beïnvloed:

  • Spesifieke kognitiewe, ontwikkelings- en funksionele profiele wat met sommige variante geassosieer word, rig prognose, bestuur en opvoedkundige intervensies.
  • Evaluasies of verwysings kan vir sindrome aangedui word om te kyk vir komplikasies wat andersins gemis kon word.
  • Gesinsstudies gee inligting oor reproduktiewe beplanning en sifting vir gesinslede wat in gevaar is.

'n OBA-diagnose kan ook psigososiale voordeel vir die gesin bied, insluitend toegang tot 'n nuwe ondersteuningsgemeenskap van individue met 'n soortgelyke diagnose. Sien die gevallevoorbeelde hieronder, en die Pas resultate-afdeling toe, vir voorbeelde en hulpbronne wat verband hou met die kliniese nut van CMA-resultate.

Moet CMA tradisionele chromosoomanalise of ander genetiese toetse vervang?

In 2010 het die American College of Medical Genetics CMA aanbeveel as eerstevlaktoetsing in die populasie van individue met ontwikkelingsagterstand, intellektuele inkorting, outismespektrum en veelvuldige aangebore afwykings.

CMA lei tot 'n diagnose in 10-15%, wat aansienlik beter is as die

3% opbrengs met tradisionele chromosoomontleding. CMA kan ook die meeste growwe chromosoomafwykings opspoor wat deur standaard kariotipe opgespoor word.

Kariotipe is steeds geskik vir pasiënte wat sterk pas by die kenmerke van 'n spesifieke chromosomale abnormaliteitsdiagnose, soos Downsindroom. Geteikende molekulêre genetiese toetsing is geskik vir toestande soos Fragile X-sindroom wat nie deur CMA opgespoor word nie. CMA kan egter nuttig wees wanneer daardie toetse nie 'n diagnose kon oplewer nie, wanneer 'n pasiënt 'n diagnose het, maar 'n ongewone verloop, of wanneer die differensiaal veelvuldige toestande met oorvleuelende kenmerke insluit.

Bevindinge wat dui op 'n spesifieke diagnose wat gerigte toetsing aandui, kan die volgende insluit:

  • Kenmerkende fisiese kenmerke
  • Spesifieke konstellasies van aangebore misvormings
  • Sekere kognitiewe/ontwikkelingsprofiele
  • Duidelike patroon van oorerwing in die familie

As jy twyfel, raadpleeg 'n kliniese of laboratoriumgenetika-spesialis (sien Hoe kry ek hulp?).

Wat is die koste en risiko's?

Oor die algemeen kos genetiese toetse meer as roetine laboratoriumtoetse. Terwyl CMA tans duurder is as tradisionele chromosoomanalise, is die diagnostiese opbrengs aansienlik hoër by pasiënte met sekere indikasies. Kostes neem af soos tegnologie verbeter.

Daar is 'n risiko van onsekere, oninsiggewende of onverwagte bevindings. 'n Negatiewe resultaat is egter nie noodwendig onbehulpsaam in 'n diagnostiese soektog nie. Die potensiële kliniese en psigososiale impak van verskeie resultate moet op 'n geval-tot-geval basis opgeweeg word. Sien die afdelings oor voor- en natoetsberading vir wenke vir hierdie proses.


Produk besonderhede

Katalogusnommer Aantal antigene Beskrywing
PA001 120 Menslike outo-antigene algemene opname
PA002 120 Menslike brein en sentrale senuweestelsel versteurings
PA003 120 Menslike kanker en neoplasmas
PA006 75 Menslike algemene allergene
PA009 41 NUUT! SARS-CoV-2 koronavirusproteïene
PA010 120 NUUT! Menslike outo-immuniteit, allergie en infeksie
PA012 120 NUUT! Menslike koronavirus-geassosieerde outo-immuniteit (CAA)

Nylon Membraan Skikkings

Waar eens die bottelnek in geenuitdrukking-analise die benchwork was, met skikkingsanalise, is dit die rekenaarwerk. Omdat 'n enkele skikking eksperiment duisende datapunte kan genereer, is die primêre uitdaging van die tegniek om sin te maak van die data. Baie kommersiële maatskappye verskaf beeldontledingsagteware, insluitend BioDiscovery (ImaGene) en Imaging Research (ArrayVision). Verder bied baie skikkingsvervaardigers sagteware spesifiek vir die ontleding van hul skikkings en bied die analise as 'n diens aan.

Vir membraan-skikking-analise word 'n lêer van die data gegenereer deur fosfobeelding en daardie lêer word dan ontleed met behulp van sagteware. Die sagteware sal kolle met gene korreleer en kan kol-intensiteite vergelyk vir differensiële uitdrukkingstudies.

Glasskikkingdata word op baie dieselfde manier behandel, maar die beeld se fluoressensie word geskandeer en die sagteware laat die opsporing van elke monster se fluoressensie individueel of gelyktydig toe vir ontleding. Die meeste sagtewarepakkette kan verskeie skikkings gelyktydig ontleed.


Databasisse vir Stelselbiologie

Jürgen Eils,. Martin Ginkel, in Computational Systems Biology, 2006

2 Standaarde

Daar is voortdurende pogings om standaarde te ontwikkel vir die rapportering en berging van eksperimentele data van spesifieke tipes metodes. Die Minimum Information About a Microarray Experiment (MIAME)-standaard is ontwikkel om data-uitvoer en beskrywing van mikroskikking-eksperimente te ondersteun met die doel van ondubbelsinnige eksperimentinterpretasie deur die hele navorsingsgemeenskap (Brazma et al. 2001). Die MicroArray Gene Expression Markup Language (MAGE-ML) is gebaseer op die MAGE objekmodel (MAGE-OM), en kan gebruik word vir mikroskikking data-uitruiling (Spellman et al. 2002). Die HUPO (Human Proteome Organisation) nomenklatuur om datavergelyking, -uitruiling en -verifikasie op die gebied van proteomika te fasiliteer, is ontwikkel deur die Proteomics Standards Initiative (Orchard et al. 2003 Orchard et al. 2005). Onlangs is 'n kommissie saamgestel met die doel om standaarde vir funksionele ensiemkarakterisering op te stel, genaamd Standards for Reporting Enzymology Data (STRENDA). Die standaarde wat in OME beskryf word vir die hantering van mikroskopiese data ondersteun projekte deur gebruik te maak van byvoorbeeld RNAi-sifting en toepassings wat multidimensionele beeldberging en analise vereis. Die XML (Extensible Markup Language)-skema, OME XML, is ingestel om data-oordrag te standaardiseer (Swedlow et al. 2003). Mikroskikking- en proteomika-standaarde is in die Systems Biology Object Model (SysBio-OM) geïnkorporeer, wat die voorstelling van mikroskikking- en proteïenuitdrukkingsdata ondersteun, asook data wat proteïen-tot-proteïen-interaksies en -metabolika beskryf (Xirasagar et al. 2004).


NUUT Produk! SARS-CoV-2 Coronavirus-antigeen-mikroskikkings. Vir meer inligting oor hierdie mikroskikkings, besoek asseblief https://www.genecopoeia.com/product/omicsarray-antigen-microarrays/.

Benewens vooraf ontwerpte skikkings, is skikkings wat pasgemaakte stelle proteïene bevat, beskikbaar, sowel as skikkingsprofieldienste en data-analise.

  • Multiplexing in staat. OmicsArray&trade-antigeen-mikroskikkings kan tot 120 antigene op 'n slag toets, in vergelyking met 1 proteïen op 'n slag vir ELISA.
  • Hoë deurset. Elke skyfie kan tot 15 monsters parallel verwerk.
  • Hoë sensitiwiteit. Elke skikking kan so min as 1 pg/ml teenliggaampies opspoor, wat 100 keer meer sensitief is as ELISA.
  • Klein monster volume. So min as 1 ul serum is nodig vir opsporing.
  • Vinnig. Van monster-tot-data in so min as 2 weke.

Glikobiologie

David F. Smith,. Richard D. Cummings, in Methods in Enzymology, 2010

2 Die Gedrukte Glycan Microarray van die Consortium for Functional Glycomics (CFG)

Glycan Array Synthesis Core (Core D) produseer die CFG glycan microarray (http://www.functionalglycomics.org/static/consortium/organization/sciCores/cored.shtml), soos voorheen beskryf (Blixt) et al., 2004). Figuur 19.1 verskaf 'n opsomming van die stappe betrokke by die vervaardiging van die glikan-skikking en die daaropvolgende ontleding van 'n GBP deur 'n verskeidenheid fluoresserende opsporingsmetodes te gebruik om data in 'n histogramformaat te produseer. Die CFG-skikking word gedruk op glasmikroskoopskyfies wat gederivatiseer is met NHS (SCHOTT Nexterion ® Slide H, SCHOTT Noord-Amerika, Elmsford, NY). Alle glikane wat beskikbaar is vir die Glycan Array Synthesis Core D van die CFG besit 'n primêre amien op 'n skakelaar wat aan die reduserende punt van elke glikaan geheg is. Die glikaanstrukture en die struktuur van individuele skakelaars vir elke weergawe van die CFG glikaan mikroskikking is beskikbaar by ( http://www.functionalglycomics.org/static/consortium/resources/resourcecoreh8.shtml ). Die eerste gedrukte glikaanmikroskikking, beskikbaar in 2005, was v2.0 en het 264 glikaanteikens bevat, en oor 5 jaar deur agt herhalings is dit uitgebrei tot 511 glikane. Elke glikaan-teiken word teen dieselfde konsentrasie (100 μM) in replikate van ses. Slegs 'n paar nanogram van elke glikaan is gekoppel aan die skyfie in 'n kol deursnee van

100 mikron. 'n GAL-lêer, wat 'n.txt lêer wat die ligging van elke kol op die mikroskikking identifiseer, elke mikroskikking definieer en glikaanvlekbelyning met fluoresserende beelde van die GBP-binding toelaat. Die gedrukte glikaan-mikro-skikkings is stabiel en gestoor by kamertemperatuur.

Figuur 19.1 . Analise van glikaanbindende proteïen (GBP) op mikroskikkings van gedefinieerde glikane. (A) Gedefinieerde glikane gedruk en kovalent gekoppel aan geaktiveerde glasskyfies word ondervra met behulp van 'n gebiotinileerde GBP en opgespoor in 'n tweede stap met sianien5-gemerkte streptavidien. (B) Alternatiewe strategieë vir die opsporing van GBP's op die mikroskikking. (C) Die gemiddelde RFU wat tydens die proses van fluoressensie skandering van replikaat kolle gegenereer word, word bereken en die data word aangebied as histogramme van fluoressensie intensiteit of relatiewe fluoressensie eenhede (RFU) met standaardafwyking of standaardfout van die gemiddelde wat in foutstawe aangedui word.


Resultate en bespreking

'n Hipotetiese scenario

Geskatte normaliseringsfaktore behoort te verseker dat 'n geen met dieselfde uitdrukkingsvlak in twee monsters nie as DE opgespoor word nie. Om die behoefte aan meer gesofistikeerde normaliseringsprosedures in RNA-volgorde-data verder uit te lig, oorweeg 'n eenvoudige gedagte-eksperiment. Stel jou voor ons het 'n volgordebepaling-eksperiment wat twee RNA-populasies, A en B, vergelyk. In hierdie hipotetiese scenario, veronderstel elke geen wat in B uitgedruk word, word in A uitgedruk met dieselfde aantal transkripsies. Aanvaar egter dat monster A ook 'n stel gene bevat wat gelyk is in getal en uitdrukking wat nie in B uitgedruk word nie. Monster A het dus twee keer soveel totale uitgedrukte gene as monster B, dit wil sê, sy RNA-produksie is twee keer so groot as monster B. Veronderstel dat elke monster dan op dieselfde diepte gerangskik word. Sonder enige bykomende aanpassing, sal 'n geen wat in beide monsters uitgedruk word, gemiddeld die helfte van die aantal lesings van monster A hê, aangesien die lesings oor twee keer soveel gene versprei is. Daarom sal die korrekte normalisering monster A met 'n faktor van 2 aanpas.

Die hipotetiese voorbeeld hierbo beklemtoon die idee dat die proporsie lees wat aan 'n gegewe geen in 'n biblioteek toegeskryf word, afhang van die uitdrukkingseienskappe van die hele monster eerder as net die uitdrukkingsvlak van daardie geen. Natuurlik is bogenoemde voorbeeld kunsmatig. Daar is egter biologiese en selfs tegniese situasies waar so 'n normalisering vereis word. Byvoorbeeld, as 'n RNA-monster besmet is, sal die lesings wat die kontaminasie verteenwoordig, lees van die ware monster wegneem, en sodoende die aantal gelees van belang laat val en die proporsie vir elke geen verreken. Soos ons egter aantoon, sal ware biologiese verskille in RNA samestelling tussen monsters die hoofrede vir normalisering wees.

Steekproefraamwerk

'n Meer formele verduideliking vir die vereiste van normalisering gebruik die volgende raamwerk. Definieer Y gkas die waargenome telling vir geen g in die biblioteek k opgesom uit die rou lees, μ gkas die ware en onbekende uitdrukkingsvlak (aantal transkripsies), L gas die lengte van geen g en N kas totale aantal leeswerk vir biblioteek k. Ons kan die verwagte waarde van modelleer Y gksoos:

S kverteenwoordig die totale RNA-uitset van 'n monster. Die probleem onderliggend aan die ontleding van RNA-volgorde-data is dat terwyl N kis bekend, S kis onbekend en kan drasties verskil van monster tot monster, afhangende van die RNA samestelling. Soos hierbo genoem, as 'n populasie 'n groter totale RNA-uitset het, sal RNA-volgende eksperimente baie gene ondermonster, relatief tot 'n ander monster.

Op hierdie stadium laat ons die afwyking in die bogenoemde model vir Y gkongespesifiseer. Afhangende van die eksperimentele situasie, lyk Poisson geskik vir tegniese herhalings [6, 7] en Negatiewe Binomiaal kan toepaslik wees vir die bykomende variasie wat uit biologiese herhalings waargeneem word [14]. Dit is ook opmerklik dat, in die praktyk, die L gword oor die algemeen geabsorbeer in die μ gkparameter en word nie in die afleidingsprosedure gebruik nie. Dit is egter goed vasgestel dat geenlengte-vooroordele prominent is in die ontleding van geenuitdrukking [15].

Die geknipte gemiddelde van M-waardes normaliseringsmetode

Die totale RNA-produksie, S k, kan nie direk geskat word nie, aangesien ons nie die uitdrukkingsvlakke en ware lengtes van elke geen ken nie. Die relatiewe RNA-produksie van twee monsters, f k = S k/S k' , in wese 'n globale vouverandering, kan makliker bepaal word. Ons stel 'n empiriese strategie voor wat die algehele uitdrukkingsvlakke van gene tussen monsters gelykstel onder die aanname dat die meerderheid van hulle nie DE is nie. Een eenvoudige dog robuuste manier om die verhouding van RNA-produksie te skat, gebruik 'n geweegde afgewerkte gemiddelde van die log-uitdrukkingsverhoudings (afgesnyde gemiddelde van M-waardes (TMM)). Vir volgordebepaling van data, definieer ons die geengewyse log-vou-veranderinge as:

en absolute uitdrukkingsvlakke:

Om die waargenome M-waardes sterk op te som, sny ons beide die M-waardes en die A-waardes af voordat die geweegde gemiddelde geneem word. Presisie (omgekeerde van die variansie) gewigte word gebruik om rekening te hou met die feit dat log vou veranderinge (effektief 'n log relatiewe risiko) van gene met groter leestellings laer variansie op die logaritme skaal het. Sien Materiale en metodes vir verdere besonderhede.

Vir 'n twee-steekproef vergelyking, slegs een relatiewe skaalfaktor (f k) word benodig. Dit kan gebruik word om beide biblioteekgroottes aan te pas (deel die verwysing deur en vermenigvuldig nie-verwysing met ) in die statistiese analise (byvoorbeeld, Fisher se presiese toets sien Materiale en metodes vir meer besonderhede).

Normaliseringsfaktore oor verskeie steekproewe kan bereken word deur een steekproef as verwysing te kies en die TMM-faktor vir elke nie-verwysingsteekproef te bereken. Soortgelyk aan twee-steekproef vergelykings, kan die TMM normalisering faktore ingebou word in die statistiese model wat gebruik word om te toets vir DE. Byvoorbeeld, 'n Poisson-model sal die waargenome biblioteekgrootte verander na 'n effektiewe biblioteekgrootte, wat die gemodelleerde gemiddelde aanpas (byvoorbeeld, deur 'n addisionele offset in 'n veralgemeende lineêre model te gebruik, sien Materiale en metodes vir verdere besonderhede).

'n Lewer-teen-nier-datastel

Ons het ons metode toegepas op 'n publiek beskikbare transkripsionele profieldatastel wat verskeie tegniese replikate van 'n lewer- en nier-RNA-bron vergelyk [6]. Figuur 1a toon die verspreiding van M-waardes tussen twee tegniese herhalings van die niermonster na die standaard normaliseringsprosedure om die totale aantal lesings te verantwoord. Die verspreiding van M-waardes vir hierdie tegniese herhalings is rondom nul gekonsentreer. Figuur 1b toon egter dat log-verhoudings tussen 'n lewer- en niermonster aansienlik verreken word na hoër uitdrukking in die nier, selfs nadat die totale aantal lesings in ag geneem is. Ook uitgelig (groen lyn) is die verspreiding van waargenome M-waardes vir 'n stel huishoudelike gene, wat 'n beduidende verskuiwing weg van nul toon. As skaal na die totale aantal lees RNA-volgorde data toepaslik genormaliseer word, word so 'n verskuiwing in die log-vou-veranderinge nie verwag nie. Die verduideliking vir hierdie vooroordeel is eenvoudig. Die M teenoor A plot in Figuur 1c illustreer dat daar 'n prominente stel gene met hoër uitdrukking in lewer bestaan ​​(swart pyl). As gevolg hiervan is die verspreiding van M-waardes (lewer na nier) skeef in die negatiewe rigting. Aangesien 'n groot hoeveelheid volgordebepaling aan hierdie lewerspesifieke gene toegewy is, is daar minder volgordebepaling beskikbaar vir die oorblywende gene, wat dus die M-waardes (en dus, die DE-oproepe) proporsioneel verwring om nierspesifiek te wees.

Normalisering word vereis vir RNA-volgorde-data. Data van [6] vergelyking van logverhoudings van (a) tegniese herhalings en (b) lewer versus nieruitdrukkingsvlakke, na aanpassing vir die totale aantal lesings in elke monster. Die groen lyn toon die gladde verspreiding van log-vou-veranderinge van die huishouding gene. (c) 'n M versus A plot wat lewer en nier vergelyk toon 'n duidelike afwyking vanaf nul. Groen punte dui 545 huishoudingsgene aan, terwyl die groen lyn die mediaan log-verhouding van die huishoudingsgene aandui. Die rooi lyn toon die geskatte TMM-normaliseringsfaktor. Die smeer van oranje punte beklemtoon die gene wat in slegs een van die lewer- of nierweefsels waargeneem is. Die swart pyl beklemtoon die stel prominente gene wat grootliks toegeskryf kan word aan die algehele vooroordeel in log-vou-veranderinge.

Die toepassing van TMM-normalisering op hierdie paar monsters lei tot 'n normaliseringsfaktor van 0.68 (-0.56 op log2-skaal getoon deur die rooi lyn in Figuur 1b, c), wat die onder-monsterneming van die meerderheid lewergene weerspieël. Die TMM faktor is robuust vir laer dekking data waar meer gene met nul tellings verwag kan word (Figuur S1a in Addisionele lêer 1) en is stabiel vir redelike waardes van die trim parameters (Figuur S1b in Addisionele lêer 1). Die gebruik van TMM-normalisering in 'n statistiese toets vir DE (sien Materiale en metodes) lei tot 'n soortgelyke aantal gene wat aansienlik hoër is in lewer (47%) en niere (53%). Daarteenoor lei die standaardnormalisering (tot die totale aantal lesings soos oorspronklik in [6] gebruik) daartoe dat die meerderheid DE-gene aansienlik hoër in nier is (77%). Opmerklik, minder as 70% van die gene wat geïdentifiseer is as DE met behulp van standaardnormalisering word steeds opgespoor na TMM-normalisering (Tabel 1). Daarbenewens vind ons dat die log-vou-veranderinge vir 'n groot stel huishoudelike gene (vanaf [16]) gemiddeld verreken word vanaf nul baie naby aan die beraamde TMM-faktor, wat dus geloofwaardigheid gee aan ons robuuste skattingsprosedure. Verder, deur die nie-aangepaste toetsprosedure te gebruik, word 8% en 70% van die huishoudelike gene aansienlik opgereguleer in onderskeidelik lewer en nier. Na TMM-aanpassing verander die proporsie van DE huishoudelike gene na onderskeidelik 26% en 41%, wat 'n laer totale getal en meer simmetries tussen die twee weefsels is. Natuurlik word die vooroordeel in log-verhoudings wat in RNA-volgorde-data waargeneem word nie in mikroskikkingsdata (van dieselfde bronne van RNA) waargeneem nie, met die veronderstelling dat die mikroskikkingdata toepaslik genormaliseer is (Figuur S2 in Addisionele lêer 1). Saamgevat dui hierdie resultate op 'n kritieke rol vir die normalisering van RNA-volgorde-data.

Ander datastelle

Die globale verskuiwing in log-vou-verandering wat veroorsaak word deur RNA samestelling verskille vind in verskillende grade plaas in ander RNA-volg datastelle. Byvoorbeeld, 'n M versus A plot vir die Cloonan et al. [12] datastel (Figuur S3 in Addisionele lêer 1) gee 'n geskatte TMM-skaalfaktor van 1.04 tussen die twee monsters (embrio-liggame versus embrioniese stamselle), gerangskik op die SOLiD™-stelsel. Die M versus A plot vir hierdie datastel beklemtoon ook 'n interessante stel gene wat 'n laer algehele uitdrukking het, maar hoër in embrio-liggame. Dit verklaar die positiewe verskuiwing in log-vou-veranderinge vir die oorblywende gene. Die TMM-skaalfaktor verskyn naby aan die mediaan log-vou-veranderinge onder 'n stel van ongeveer 500 muis huishouding gene (vanaf [17]). As nog 'n voorbeeld, die Li et al. [18] datastel, met behulp van die llumina 1G Genome Analyzer, toon 'n verskuiwing in die algehele verspreiding van log-vou-veranderinge en gee 'n TMM-skaalfaktor van 0,904 (Figuur S4 in Addisionele lêer 1). Daar is egter volgorde-gebaseerde datastelle wat redelik soortgelyke RNA-uitsette het en dalk nie 'n beduidende aanpassing benodig nie. Byvoorbeeld, die klein-RNA-volg data van Kuchenbauer et al. [19] toon slegs 'n beskeie vooroordeel in die log-vou-veranderinge (Figuur S5 in Addisionele lêer 1).

Spike-in kontroles het die potensiaal om vir normalisering gebruik te word. In hierdie scenario word klein maar bekende hoeveelhede RNA van 'n vreemde organisme by elke monster by 'n gespesifiseerde konsentrasie gevoeg. Ten einde insteekkontroles vir normalisering te gebruik, moet die verhouding van die konsentrasie van die aar tot die monster konstant gehou word deur die eksperiment. In die praktyk is dit moeilik om te bereik en klein variasies sal lei tot bevooroordeelde skatting van die normaliseringsfaktor. Byvoorbeeld, die gebruik van die ingeboude DNA van die Mortazavi et al. datastel [11] sou lei tot onrealistiese normaliseringsfaktorskattings (Figuur S6 in Addisionele lêer 1). Soos met mikroskikkings, is dit oor die algemeen meer robuust om normaliseringsfaktore noukeurig te skat met behulp van die eksperimentele data (byvoorbeeld [20]).

Simulasie studies

Om die omvang in bruikbaarheid van die TMM-normaliseringsmetode te ondersoek, het ons 'n simulasieraamwerk ontwikkel om die effekte van RNA-samestelling op DE-analise van RNA-volgorde-data te bestudeer. Om te begin, simuleer ons data uit net twee biblioteke. Ons sluit parameters in vir die aantal gene wat uniek aan elke monster uitgedruk word, en parameters vir die proporsie, grootte en rigting van differensieel uitgedrukte gene tussen monsters (sien Materiaal en metodes). Figuur 2a toon 'n M versus A plot vir 'n tipiese simulasie insluitend unieke gene en DE gene. Deur verskillende totale RNA-uitsette te simuleer, het die meerderheid nie-DE-gene log-vou-veranderinge wat vanaf nul verreken is. In hierdie geval, die gebruik van TMM normalisering om rekening te hou met die onderliggende RNA samestelling lei tot 'n laer aantal vals opsporings met behulp van 'n Fisher se presiese toets (Figuur 2b). Deur die simulasie 'n groot aantal kere oor 'n wye reeks simulasieparameters te herhaal, vind ons goeie ooreenkoms wanneer die ware normaliseringsfaktore van die simulasie vergelyk word met dié wat met behulp van TMM-normalisering beraam word (Figuur S7 in Addisionele lêer 1).

Simulasies toon dat TMM-normalisering robuust is en beter as biblioteekgrootte-normalisering presteer. (a) 'n Voorbeeld van die simulasieresultate wat die behoefte aan normalisering toon as gevolg van gene wat uniek uitgedruk word in een monster (oranje kolletjies) en asimmetriese DE (blou kolletjies). (b) 'n Laer vals positiewe koers word waargeneem met behulp van TMM normalisering in vergelyking met standaard normalisering.

Om die prestasie van die TMM-normalisering verder te vergelyk met voorheen gebruikte metodes in die konteks van die DE-analise van RNA-volgorde-data, brei ons die bogenoemde simulasie uit om replikaatvolgorde-lopies in te sluit. Spesifiek, ons vergelyk drie gepubliseerde metodes: lengte-genormaliseerde teldata wat log-getransformeer is en kwantiel genormaliseer, soos geïmplementeer deur Cloonan et al. [12], 'n Poisson-regressie [6] met biblioteekgrootte en TMM-normalisering en 'n Poisson-eksakte toets [8] met biblioteekgrootte en TMM-normalisering. Ons vergelyk nie direk met die normalisering wat in Balwierz voorgestel word nie et al. [13] aangesien die lewer- en nierdatastel blykbaar nie 'n kragwetverspreiding volg nie en redelik duidelike telverdelings het (Figuur S8 in Addisionele lêer 1). Verder, in die lig van die RNA samestelling vooroordeel wat ons waarneem, is dit nie duidelik of die gelykstelling van die telverdelings oor monsters die mees logiese prosedure is nie. Daarbenewens vergelyk ons ​​nie die normalisering direk met virtuele lengte [2] of RPKM [11] normalisering nie, aangesien 'n statistiese analise van die getransformeerde data nie genoem is nie. Ons illustreer egter met M versus A plotte dat hul normalisering nie heeltemal RNA samestelling vooroordeel verwyder nie (Figure S9 en S10 in Addisionele lêer 1).

Vir die simulasie het ons 'n empiriese gesamentlike verspreiding van geenlengtes en tellings gebruik, aangesien die Cloonan et al. prosedure vereis beide. Ons het die simulasiedata Poisson-verspreid gemaak om tegniese herhalings na te boots (Figuur S11 in Addisionele lêer 1). Figuur 3a toon vals ontdekking plotte tussen die gene wat gemeen is aan beide toestande, waar ons 10% uniek-tot-groep uitdrukking ingestel het vir die eerste toestand, 5% DE op 'n 2-voudige vlak, waarvan 80% hoër is in die eerste voorwaarde. Die benadering wat metodologie gebruik wat vir mikroskikkingdata ontwikkel is, presteer eenvormig swakker, soos 'n mens kan verwag aangesien die verspreidingsaannames vir hierdie metodes heelwat verskil. Onder die oorblywende metodes (Poisson-waarskynlikheidsverhoudingstatistiek, Poisson-eksakte statistiek), is prestasie weer baie soortgelyk, die TMM-normalisering maak 'n dramatiese verbetering aan beide.

Valse ontdekkingskomplotte wat verskeie gepubliseerde metodes vergelyk. Die rooi lyn beeld die lengte-genormaliseerde gemodereerde t-statistiek analise uit. Die soliede en stippellyne wys onderskeidelik die biblioteekgrootte genormaliseerde en TMM genormaliseerde Poisson model analise. Die blou en swart lyne verteenwoordig onderskeidelik die LR-toets en presiese toets. Dit kan gesien word dat die gebruik van TMM-normalisering 'n baie laer valse ontdekkingsyfer tot gevolg het.


Gevolgtrekkings

Die volgordebepaling van hele genome en die bekendstelling van tegnologieë wat in staat is om gelyktydig die uitdrukking van duisende gene te meet, verskaf aan biologiese navorsing 'n globale perspektief wat die neiging oor die afgelope paar dekades van die vernouing tot hoogs gespesialiseerde navorsingsvelde teenstaan. Maar die optimale ontginning van hierdie waardevolle hulpbronne deur navorsers noodsaak die ontwikkeling van mynbou-instrumente om data te verken en te interpreteer in 'n tydraamwerk wat versoenbaar is met die indrukwekkende tempo waarteen dit gegenereer word. Individuele kennis word gebou op assosiasies wat gemaak word tussen die inligting wat ons uit die literatuur verkry. Die metode wat ons hier beskryf boots hierdie leerproses na deur betekenisvolle terme wat in wetenskaplike publikasies gevind word, te assosieer om 'n samehangende prentjie te skep van die verwantskappe wat bestaan ​​binne komplekse groepe gene. Omdat hierdie analise onafhanklik van kennis van geenfunksie uitgevoer word, bied dit 'n manier om vinnig die biologiese betekenis van komplekse uitdrukkingsdata op 'n onbevooroordeelde wyse te ondersoek.


Toekomstige aanwysings

Die praktyk om genetiese afwykings te bestudeer, verander van ondersoek van enkele gene in isolasie na die ontdekking van sellulêre netwerke van gene, die begrip van hul komplekse interaksies en die identifisering van hul rol in siekte. 19 As gevolg hiervan sal 'n hele nuwe era van individueel-aangepaste medisyne ontstaan. Bioinformatics will guide and help molecular biologists and clinical researchers to capitalise on the advantages brought by computational biology. 20 The clinical research teams that will be most successful in the coming decades will be those that can switch effortlessly between the laboratory bench, clinical practice, and the use of these sophisticated computational tools.


Kyk die video: What Did NASA Photograph On Jupiter? Real Pictures (Oktober 2022).