Inligting

Is SNP's of SSR-kopiegetalvariasiemutasies meer prominent?

Is SNP's of SSR-kopiegetalvariasiemutasies meer prominent?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ek probeer 'n gevoel kry van die dominante manier waarop mutasies voorkom. Ek het verskeie syfers gesien wat ten minste met die eerste oogopslag op konflik lyk, en ek was nuuskierig of iemand verduideliking hieroor het.

Volgens Shastry, "SNP allele in menslike siekte en evolusie" (Tydskrif vir Mensgenetika 47:561-566, 2002),

In twee ewekansig geselekteerde menslike genome is 99,9% van die DNS-volgorde identies. Die oorblywende 0,1% van DNS bevat volgordevariasies. Die mees algemene tipe so 'n variasie word 'n enkelnukleotied polimorfisme, of SNP, genoem.

Maar volgens Nevo, "genetiese diversiteit" (Ensiklopedie van Biodiversiteit, 2001),

Dit is betekenisvol dat SSR's mutasie ervaar teen aansienlik hoër tempo as nie-herhalende reekse: $10^{-2}$ aan $10^{-3}$ per lokus, per gameet, per generasie, wat lei tot hul hoë polimorfisme.

Boonop, volgens Kashi en King, "Simple Sequence Repeats as Advantageous Mutators in Evolution", (TENDENSE in Genetika 22(5):257),

Mutasies wat herhalingsgetal verander kom tipies voor teen tempo's van grootteordes groter as enkelnukleotiedpuntmutasies.

Dus, as variasies in organismes meestal te wyte is aan SSR'e, en dit is meestal kopiegetalvariasie, sou dit dan korrek wees om te sê dat kopiegetalvariante in SSR'e die dominante vorm van variasie is, of mis ek iets? Watter een is korrek, of watter bron is meer gesaghebbend, of is daar 'n meer bygewerkte resensie wat ek moet raadpleeg?


Ek hou van @mgkrebbs antwoord, ek dink dit tref die meeste van die hoogtepunte, maar ek het 'n paar jaar gelede 'n resensie oor hierdie onderwerp geskryf waar ons spesifiek skattings op die mutasielading van verskillende mutasieklasse saamgestel het (sien Tabel 1).

Yaniv Erlich se groep het die vraag wat jy probeer beantwoord direk aangespreek, en hulle het beraam dat mikrosatelliete effens meer mutasies per generasie bydra as substitusies:

Hierdie voorspellings dui aan dat die vrag van de novo STR [SSR] mutasies ten minste 75 mutasies per generasie is, wat die las van alle ander bekende variant tipes meeding.

Die meeste skattings van diploïede algehele substitusiemutasiekoerse is ~50/generasie, ter vergelyking.

As jy egter belangstel in die algehele variantnommer, sal jy ook 'n ongelooflike komplekse argitektuur van strukturele variante in basies enige genoom in ag moet neem, insluitend ook plasmiede, virusse en transposons. So wanneer jy praat van die "dominante vorm van variasie", moet jy regtig 'n bietjie meer spesifiek wees. Op 'n per lokus of selfs per mutasie klas basis is STR'e/SSR'e waarskynlik "dominant", maar dit is moeilik om te argumenteer dat bv. 1 STR mutasie is belangriker as een transposon hop of een chromosoom aneuploïdie of een sentromeriese satelliet sametrekking.

Ek sal aanbeveel om die vraestelle wat gekoppel is te lees vir 'n bietjie meer konteks.


Dit is nie regtig vir my duidelik waarna jy soek as jy vra oor hoe prominent of dominant hierdie twee soorte variasies is nie. Maar kom ons kyk dieper.

Guichoux et al. (1) sê:

Daar is twee hoofverskille tussen SSR's en SNP's. Eerstens is SNP's meer as SSR's in die genoom van die meeste spesies. Gemiddeld, in die menslike genoom, is daar een SNP elke 100-300 bp (Thorisson et al. 2005), in vergelyking met een SSR-lokus elke 2-30 kb (Webster et al. 2002), afhangende van hoe SSR'e is gedefinieer (Kelkar et al. 2010). Dit kan belangrik wees vir genoomwye assosiasiestudies, maar nie noodwendig vir ander toepassings nie. Tweedens verskil die mutasietempo per generasie drasties tussen die twee merkertipes. SSR'e het mutasietempo's wat wissel van $10^3$ aan $10^4$ per lokus per generasie (Ellegren 2000), in vergelyking met ongeveer $10^9$ vir SNP's, dit wil sê verskeie ordes van grootte laer. Gevolglik is SNP's tipies diallelies: In mense is < 0.1% van SNP's triallelies (Lai 2001). Daarteenoor het SSR-lokusse oor die algemeen 'n hoë alleliese rykdom, dikwels meer as 10 allele.

Op grond van hierdie getalle kom SNP's miskien 80 keer so dikwels voor as SSR'e. Is dit meer prominent?

'n SSR is groter as 'n SNP, en dek miskien honderd tot 'n paar honderd basisse teenoor een basis (per definisie). 'n SSR lokus kom ook in veelvuldige variante voor, bv. met 'n kopienommer uit 'n wye reeks, teenoor slegs twee moontlike variante wat gewoonlik vir 'n SNP-lokus voorkom.

Die mutasietempo's verskil aansienlik, blykbaar tipies 5 ordes van grootte meer gereeld vir SSR'e as vir SNP's. Let egter daarop dat mutasietempo nie die frekwensie van variante wat in die genome van bestaande organismes gesien word direk beïnvloed nie: die variante teenwoordig is 'n gevolg van die filter van mutasies deur die kragte van seleksie.

Let ook daarop dat alle basisse onderhewig is aan mutasie, wat 'n SNP produseer, maar SSR-mutasies vind slegs plaas waar 'n herhalende volgorde reeds bestaan. (Ook, die waarskynlikheid van mutasie word slegs beduidend wanneer die bestaande volgorde meer as 'n paar herhalings het, aangesien die meganisme van mutasie hiervan afhang.)

'n Hoofvraag is egter wat die betekenis van die variasie is? Stel jy belang in variasie net omdat hulle individuele genome binne 'n populasie merk, of stel jy belang in die variasie van die fenotipes van individue? Sommige genetiese lokusse is irrelevant vir fenotipe en sommige kan die fenotipe in mindere of meerdere mate beïnvloed. SNP's kan enige plek voorkom, dus kan aanvaar word dat dit 'n "regverdige" kans het om fenotipe te beïnvloed. Aan die ander kant kan SSR'e voorkom waar slegs herhalende rye kan voorkom (en voortduur waar hulle selektiewe kragte oorleef). Met SSR's, kan wisselende kopiegetal in sommige kontekste soos proteïenkoderingvolgordes, groter fenotipe-effekte hê as 'n SNP, en dus onderhewig wees aan sterker seleksiekragte.

My siening is dat beide SSR's en SNP's belangrik is en dit is nie vreeslik produktief om bekommerd te wees oor algemene prominensie of dominansie van die een oor die ander nie.

Verwysing:

(1) Guichoux, Erwan & Lagache, Lelia & Wagner, Stefanie & Chaumeil, Philippe & Léger, Patrick & Lepais, Olivier & Lepoittevin, Camille & Malausa, Thibaut & Revardel, Emmanuelle & Salin, Franck & Petit, Rémy. (2011). Huidige tendense in mikrosatelliet genotipering. Molekulêre ekologie hulpbronne. 11. 591-611. 10.1111/j.1755-0998.2011.03014.x.


Epilepsie is 'n komplekse neurologiese afwyking wat 70 miljoen mense wêreldwyd affekteer. Een van die groot kwessies rakende epilepsiebestuur is weerstand teen behandeling. Die koppeling van die meganismes van geneesmiddelwerking met die individuele patogenetiese meganismes van epilepsie verteenwoordig die beste strategie vir persoonlike en effektiewe medikasie. In hierdie verband kan genoomwye analise en uitgebreide databasis gebruik word om die etiopatogeniese meganismes onderliggend aan epilepsie in individuele pasiënte te karakteriseer en die mees effektiewe middels te identifiseer.

In die huidige referaat bied ons 'n sisteembiologie-benadering aan om die rol van Kopiegetalvariasies (KNV's) te interpreteer in 'n 27-jarige man wat geraak word deur refraktêre-epilepsie wat met intellektuele gestremdheid geassosieer word. Benewens die identifisering van veroorsakende genotipe-fenotipe korrelasies, het die sinergistiese integrasie van genomiese data die chromosomale afwykings wat onderliggend aan die farmako-weerstandige fenotipe kan ontsyfer, toegelaat.

Gegewe die hoë multifaktoraliteit van geneesmiddelweerstand in epilepsie, kan die sisteembiologie-benadering wat hier gebruik word, 'n geldige hulpmiddel vir die farmakologiese bestuur daarvan verteenwoordig.


Agtergrond

Amiotrofiese laterale sklerose (ALS) is 'n vernietigende onbehandelbare neurodegeneratiewe siekte wat gekenmerk word deur die selektiewe degenerasie van motorneurone in die brein en rugmurg, wat lei tot verlamming en dood, gewoonlik as gevolg van respiratoriese versaking, binne 3-5 jaar na aanvang [1]. Die siekte bestaan ​​in twee vorme: familiële ALS (FALS) en sporadiese ALS (SALS). FALS is 'n seldsame monogene siekte wat in 5–10% van gevalle met 'n outosomale dominante oorerwing voorkom en waarvoor verskeie oorsaaklike gene geïdentifiseer is, insluitend SOD1, ALS2, SETX, SPG11, FUS, VAPB, ANG, TARDBP, FIG4, OPTN, ATXN2, UBQLN2, PGRN, PFN1, DCTN1, en C9ORF72 [2]. SALS bestaan ​​uit die meerderheid (90-98%) van ALS-gevalle en word as 'n komplekse multifaktoriale versteuring beskou, wat veelvuldige patogene prosesse behels, soos oksidatiewe stres, proteïenaggregasie, mitochondriale disfunksie, eksitotoksisiteit en verswakte aksonale vervoer (Fig. 1). [3]. Alhoewel daar nog stukke ontbreek in die ingewikkelde mosaïek van SALS-patogenese, het verskeie studies die belangrike bydrae van genetiese risikofaktore, gewoonlik geassosieer met onvolledige penetrasie, en geen-omgewing-interaksies vir siektevatbaarheid erken (Fig. 1).

Skematiese voorstelling van die komplekse mosaïek van ALS-patogenese

Die merkwaardige vooruitgang in genoomtegnologieë oor die afgelope jare het gelei tot groot vordering in die begrip van die genetiese meganismes betrokke by ALS. Die soeke na patogene variante is aanvanklik hoofsaaklik gefokus op variasies op die enkel-nukleotied polimorfisme (SNP) vlak. In die laaste jare het verskeie kandidaat-geen- of genoomwye assosiasiestudies (GWAS) verskeie SNP's geïdentifiseer wat potensieel ALS-geassosieerde gene beïnvloed, insluitend VEGFA, ANG, FGGY, DPP6, ITPR2, KIFAP3, en UNC13A [4–7]. Die bydrae van nukleotiedvolgorde-abnormaliteite in SALS-patogenese het egter onduidelik gebly, met puntmutasies in die bogenoemde gene wat slegs selde voorkom.

Benewens SNP's, verteenwoordig submikroskopiese chromosomale veranderinge, ook bekend as kopiegetalvariasies (CNV's), 'n wesenlike bron van inter-individuele genetiese variasies wat belangrike fenotipiese effekte op die uitdrukking en funksie van gene uitoefen en een van die belangrikste risikofaktore vir verskeie komplekse menslike afwykings insluitend ALS [8, 9]. Die meerderheid bestaande CNV genotiperingstudies gebruik 'n tradisionele enkelgeenbenadering wat, alhoewel waardevolle inligting verskaf het oor die impak van individuele algemene variante, onvoldoende is om genetiese argitekture van komplekse eienskappe soos ALS te ontbloot, wat dikwels lei tot die verlies van minder gereeld maar potensieel funksioneel relevante CNV-gedrewe geenstelle. In hierdie konteks bied die holistiese "stelselbiologie"-benadering 'n nuwe perspektief in die studie van komplekse siekte-eienskappe, wat verder gaan as die konvensionele een-geen-op-'n-tyd toetsskema, en die hele ewewig van 'n biologiese sisteem omhels wat ondergaan. 'n baie meer ingewikkelde netwerk van molekulêre komponente wat in assosiasie die waarskynlikheid verhoog om die siekte te ontwikkel (Fig. 2) [10].

Die sisteembiologie-benadering: van integrasie van grootskaalse "omics"-data tot gepersonaliseerde medisynepraktyk

In hierdie oorsig sal ons die tans bekende landskap van KNV's verken, met spesifieke klem op CNV-gedrewe gene wat konsekwent geassosieer is met 'n verhoogde risiko van ALS, met inagneming van hul potensiële funksionele impak in die patofisiologie van die siekte. Daarbenewens sal ons die potensiële bydrae van verskeie seldsame KNV's in ALS-patogenese ondersoek, en ons aandag fokus op die komplekse meganismes waardeur hierdie proteïene individueel of in kombinasie kan 'n impak op die genetiese vatbaarheid van ALS.


Die heilige lotus (Nelumbo nucifera) word wyd gekweek in Oos-Asië vir sy tuinbou-, landbou- en medisinale waardes. Alhoewel baie molekulêre merkers gebruik is om bevolkingsgenetika van die heilige lotus te ekstrapoleer, is 'n studie van groot variasies, soos kopiegetalvariasie (CNV), tot dusver afwesig. In hierdie studie het ons heel-genoom-hervolgordebepaling op 24 lotus-toetredings toegepas, en gebruik lees-diepte-inligting om oorspronklike CNV-oproep te genotipeer en te filter. Altesaam 448 dupliserings en 4 267 delesies is in die finale CNV-stel geïdentifiseer. Verdere ontleding van bevolkingstruktuur het aan die lig gebring dat die bevolkingstruktuurpatrone wat deur CNV en SNP geopenbaar is, grootliks met mekaar ooreenstem. Ons resultaat het aangedui dat diep volgordebepaling gevolg deur genotipering 'n vinnige en eenvoudige manier is om CNV uit die bevolking te ontgin, en die CNV saam met SNP kan ons in staat stel om die biologie van die plant beter te begryp.

Resultaat van heel-genoom hervolgordebepaling na 24 lotustoegange dui aan dat diepvolgordebepaling gevolg deur genotipering 'n vinnige en eenvoudige manier is vir CNV-roeping.


Materiale en Metodes

Vlieë, reeksdata en leeskartering

Drosophilamelanogaster isofale lyne van Maine (n = 16), Florida (n = 16), Tasmanië (n = 15), en Queensland (n = 17) is voorheen beskryf (Turner et al. 2008). Noord-Amerikaanse D. simulans isofale lyne was van Fairfield, ME (n = 50) en Homestead, FL (n = 33) en is deur Perot Saelao versamel. Australiese D. simulans monsters is van Sorrell, Tas (n = 16) en Maryborough, Qld (n = 22) deur Arthur et al (2008). Vir elke populasiesteekproef is 'n enkele vroulike vlieg ewekansig uit elke isofale lyn gekies. Die vlieë van 'n populasie is toe saamgevoeg en Illumina-biblioteke is gebou—een per populasie (Kolaczkowski et al. 2011 Reinhardt et al. 2014). Hierdie biblioteke is dan met behulp van die Illumina Genome Analyzer II gevolgorde (Reinhardt et al. 2014). Albei van die Australiër melanogaster volgordebepaling biblioteke was enkel-end. Die oorblywende volgordebepalingsbiblioteke was almal gepaardgaande. Die getalle van opeenvolgende fragmente, gemiddelde insetselgroottes en gemiddelde dekkingsdieptes na kartering vir elk van hierdie agt saamgevoegde reekslopies word in aanvullende tabel S1, Aanvullende Materiaal aanlyn getoon. Met behulp van BWA weergawe 0.5.9 (Li en Durbin 2009), het ons gekarteer D. melanogaster lees om vyf van die vry te stel melanogaster samestelling met herhalende elemente gemasker deur RepeatMasker (http://www.repeatmasker.org), en D. simulans lees na 'n opgedateerde D. simulans samestelling (Hu et al. 2013). Die D. melanogaster data is van Reinhardt et al. (2014), en is beskikbaar op die Kortleesargief (bioprojektoegangsnommer PRJNA237820). Die D. simulans data is ook na die Kortleesargief opgelaai (bioprojeknommer PRJNA308157 vir Maine-monsters PRJNA307610 vir alle ander).

Opsporing van gedifferensieerde CNV's van saamgevoegde gepaarde-end-volgordedata

Ons het CNV's opgespoor wat in alleelfrekwensie gedifferensieer is langs elke kliniek in elke spesie met behulp van 'n kombinasie van leesdiepte en teenstrydige gepaarde-end-karteringdata soos beskryf in Schrider, Begun, et al. (2013). Kortliks, uit elke saamgevoegde steekproef het ons nabygeleë pare leesstukke gegroepeer wat gekarteer is in 'n oriëntasie wat aandui van 'n skrapping (d.w.s. verder van mekaar gekarteer as wat verwag is) of van 'n tandem duplisering (in "verdraaide" oriëntasie Cooper et al. 2008). Ons het toe die aantal gekarteerde leespare (of enkellesings in enkel-eindmonsters) getel wat die CNV by die twee eindpunte van die kliniek ondersteun (nul as die nieverwysingsalleel heeltemal onopgespoor is by daardie eindpunt) en het die verskil tussen die twee geneem. Ons het van mening dat KNV'e waarvoor hierdie verskil in óf die boonste óf onderste 5% onder alle kandidaat KNV'e was, potensieel gedifferensieer is, maar het alle vermeende KNV'e <50 bp in lengte weggelaat.

Ons het dan leesdiepte-inligting gebruik om elke potensieel gedifferensieerde CNV te bevestig of te verwerp deur te vra of die verhouding van leesdieptes tussen die twee kliniese punte (weereens, herhalende DNA ignoreer) aansienlik van 1:1 afwyk in die rigting wat deur die verskil in die getal voorspel is. van leespare wat die CNV ondersteun. Die betekenisafsnypunte is empiries bepaal deur ewekansig genomiese streke van 'n gegewe lengte te selekteer en die verhouding van leesdieptes getel vanaf die twee punte van die kliniek te meet, en die boonste en onderste 5% afsnypunte van die gevolglike verspreiding te selekteer. KNV'e met beide 'n beduidende verskil in ondersteunende leespare en 'n ooreenstemmende uiterste leesdiepteverhouding is beskou as gedifferensieer tussen die kliniese eindpunte. Eerder as om hierdie leesdiepteverhouding afsnypunte vir elke CNV-lengte te bereken, het ons afsnypunte vir verskeie lengtes bereken en vir 'n gegewe CNV het ons die afsnypunte vir die naaste lengte van mindere of gelyke waarde gebruik. Hierdie lengtes was: 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900 bp. , 4, 4,5, 5, 6, 7, 8, 9, 10, 20, 30, 400, 50 en 100 kb. Alhoewel die aantal gemonsterde vlieë ramings van alleelfrekwensie binne saamgevoegde monsters en dus differensiasie tussen populasies kan beïnvloed (Kolaczkowski et al. 2011 Zhu et al. 2018), behoort ons empiriese uitskieter-gebaseerde benadering onaangeraak te wees, aangesien ons die waarskynlikheid van 'n gedifferensieerde CNV wat op een kontinent opgespoor is, blyk toevallig op die ander gedifferensieer te word tot 0.05.

In D. simulans, het ons 'n groot aantal CNV's op die X-chromosoom opgespoor tussen posisies 7000000 en 8300000 wat mekaar oorvleuel, en 'n soortgelyke streek op chromosoomarm 2R tussen posisies 331000 en 722000. Alhoewel dit duidelike CNV's van swak of herhalende artefakte kan verteenwoordig eerder as artefakte volgorde in hierdie streek, uit hierdie twee streke het ons konserwatief alle oorvleuelende CNV's van dieselfde tipe verwyder (dws duplisering of skrapping) behalwe vir die grootste een om te verhoed dat oortelling toetse van oorvleueling tussen kontinente en GO-verryking beïnvloed. Wanneer getoets word vir die betekenis van die oorvleueling tussen CNV's wat in Noord-Amerika en Australië in D. simulans, het ons 'n binomiale toets gebruik vir 'n ongewone breuk van Noord-Amerikaanse gedifferensieerde CNV's wat ook in Australië gedifferensieer is (verwagte breuk = 0.05). Ons het toe die fraksie van Australiese KNV's getoets vir oorvleueling met Noord-Amerikaanse KNV'e op dieselfde manier. Ons het konserwatief die grootste van die twee geneem P waardes wat uit hierdie twee toetse voortspruit.

Substeekproeflesings om die impak van verskille in dekking te evalueer

Om die effek van die groter dekking in Maine as Florida op ons CNV-oproepe te bepaal, het ons die stel gekarteerde fragmente uit die Maine-datastel gesubsteekproef om by die aantal fragmente in Florida te pas. Dit het daartoe gelei dat 'n fraksie (sowat 23%) van leespare wat die teenwoordigheid van CNV's in Maine ondersteun, uitgegooi is. Ons het toe gevra watter fraksie van die gedifferensieerde CNV's in ons volledige datastel ook as gedifferensieerde geklassifiseer word (volgens die afsnypunte hierbo beskryf) na hierdie substeekproefneming, en hierdie proses 1 000 keer herhaal. Gemiddeld is 86.5% van die KNV'e in ons oorspronklike Noord-Amerika herwin soos gedifferensieer in die substeekproefstel.

Opsporing van gedifferensieerde CNV's van leesdiepte alleen en samevoeging van CNV-oproepe

Omdat die Australiese D. melanogaster reekse was slegs enkel-end, ons het 'n versteekte Markov model (HMM) gebruik om gedifferensieerde CNV's op te spoor vanaf leesdiepte langs beide kline na Schrider, Begun, et al. (2013). Oorgangs- en emissiewaarskynlikhede is beraam vanaf CNV's wat langs beide klinies gedifferensieer is. Vir die Noord-Amerikaanse HMM is die verhoudings van leesdieptes van die Noord-Amerikaanse data in hierdie CNV's gebruik om die parameters te skat. Vir die Australiese HMM is die verhoudings van leesdieptes van die Australiese data in hierdie CNV's gebruik. Ons het toe die Viterbi-algoritme gebruik om die genoom in drie toestande te segmenteer: Hoër kopie-getal in die gematigde cline-eindpunt, hoër kopie-getal in die tropiese cline-eindpunt, en geen verskil in kopie-getal nie. Om te bepaal watter CNV's wat deur hierdie HMM ontbloot is ook langs die ander kontinent gedifferensieer is, het ons leespare wat binne die CNV getel is vanaf elke eindpunt van die kliniek en gevra of die verhouding in óf 5% stert van die empiriese verspreiding was soos hierbo beskryf. Ons het ook CNV's wat op beide kline (met enige metode) opgespoor is, getel as 'n enkele gebeurtenis as elkeen die ander oor ten minste 50% van sy volgorde oorvleuel in sulke gevalle, is aanvaar dat die CNV die hele gebied strek wat deur enige van hierdie twee CNV's omring word . CNV's wat slegs vanaf leesdiepte bespeur word, word in aanvullende tabel S3, Aanvullende materiaal aanlyn gelys.

Vir elke CNV wat deur die HMM opgespoor is, het ons die gemiddelde leesdiepte in elke klinieseindpunt ondersoek en gevra watter meer van die genoomwye gemiddelde afwyk. As leesdiepte in hierdie saamgevoegde monster groter was as die genoomwye gemiddelde, het ons afgelei dat die CNV 'n duplisering relatief tot die verwysingsgenoom is, en andersins afgelei die CNV is 'n delesie relatief tot die verwysing.

Vergelyk uitdrukkingsverskille met kopie-nommer-differensiasie

Ons het die log geneem2 vouverskille in uitdrukking tussen die noordelike en suidelike eindpunte van die Noord-Amerikaanse kliniek van Zhao et al. (2015) vir elke geen wat ten minste gedeeltelik in 'n CNV woon wat in Noord-Amerika (of albei kontinente) gedifferensieer is. Vir elk van hierdie gene het ons dan die verhouding van Florida:Maine-leesdieptes geneem as 'n maatstaf van kopie-nommer-differensiasie tussen die twee klinieseindpunte. Ons het toe gevra of daar oor gene wat in kopie-nommer gedifferensieer is, 'n korrelasie was tussen vouverskil in uitdrukking en leesdiepteverhouding. Ons het hierdie analise twee keer uitgevoer: Een keer met behulp van uitdrukkingsdata van vlieë wat by 21 ° C grootgemaak is, en een keer met 29 ° C. As 'n geen teenwoordig was in veelvuldige gedifferensieerde KNV's, het ons die leesdiepteverhouding ewekansig uit slegs een van hierdie KNV's gekies vir insluiting voordat Spearman se rangkorrelasiekoëffisiënt bereken is. Net so, as 'n CNV veelvuldige gene bevat het, het ons ewekansig die uitdrukkingswaarde van een van hierdie gene gekies vir insluiting in die analise.

Identifisering van CNV's wat op beide vastelande gedifferensieer is

Ons het twee benaderings gebruik om CNV's te identifiseer wat op beide kontinente binne 'n gegewe spesie gedifferensieer is. Eerstens, as ons twee CNV's gevind het, een van elke kontinent, met ten minste 50% van die lengte van elke CNV wat die ander oorvleuel, het ons hulle as dieselfde CNV behandel. Tweedens, vir enige CNV wat in een kontinent opgespoor is, het ons die CNV as gedifferensieer op die ander kontinent getel as die leesdiepteverhouding in daardie kontinent gevind is binne óf 5% stert van die verspreiding van leesdieptes gevind in ewekansig geselekteerde streke van 'n soortgelyke ( maar nie groter as die CNV nie.

Toets vir 'n korrelasie tussen rekombinasiekoerse en CNV-digthede

Ons het Comeron et al. (2012) se rekombinasietempo skattings gebruik (afgelaai van http://www.recombinome.com/), en die aantal gedifferensieerde KNV'e in getel D. melanogaster waarvan die begin (mees links) posisie gevind is binne elke 100-kb rekombinasie tempo venster. Een CNV was baie naby aan die proksimale telomeer van chr3L geleë waar geen rekombinasietempo skatting beskikbaar was nie, en is dus uit die analise weggelaat. Ons het toe gevra of daar 'n beduidende korrelasie was tussen die aantal CNV's wat in elke venster gevind word en die beraamde rekombinasietempo daarvan.

Toets vir verryking van annotasiekategorieë

Ons het getoets vir statistiese verryking van volledige gene, eksoniese basispare en introniese basispare, binne alle gedifferensieerde KNV's wat in 'n spesie gevind word, sowel as die aantal sulke KNV's wat groot inversies oorvleuel. Ons het ook getoets vir die verryking van GO-terme wat verband hou met gene wat CNV's oorvleuel wat op beide klinies in dieselfde rigting gedifferensieer is met betrekking tot afstand vanaf die ewenaar. Vir verrykingstoetsing in D. melanogaster, het ons geenliggings en GO-aantekeninge van FlyBase-vrystelling 33 gebruik (Tweedie et al. 2009). Vir D. simulans, het ons die liggings van ortoloë gebruik om FlyBase vry te stel 33 gene gevind deur Hu et al. (2013) en weer die FlyBase GO-aantekeninge gebruik. Ons het toe bereken P waardes vir elke GO-term of annotasiekategorie deur die stel CNV-koördinate 10 000 keer te permuteer en die aantal voorkomste van elke annotasiekenmerk in hierdie gepermuteerde stelle te vergelyk met die ware stel. Vir waargenome GO-terme, het ons FDR (q waardes) deur die benadering van Storey (2002) te gebruik, en die drie GO-naamruimtes (biologiese proses, molekulêre funksie en sellulêre komponent) afsonderlik te behandel. Om oortelling van GO-terme as gevolg van ruimtelike groepering van funksioneel verwante gene te vermy, het ons elke GO-term wat deur 'n gegewe CNV teëgekom word, slegs een keer getel, selfs al het daardie term in veelvuldige gene verskyn wat die CNV oorvleuel.


Agtergrond

Kopiegetalvariasies (CNV's) is groot delesies en duplisering van segmente van die chromosoom. CNV's is deurdringend in die menslike genoom en speel 'n oorsaaklike rol in siektes soos kanker [1]. In die studie van siektes verskyn CNV's gewoonlik in twee kontekste: kiemlyn CNV's verwys na oorgeërfde variante, waarvan baie polimorfies is op bevolkingsvlak [2] in teenstelling, somaties CNV's, ook na verwys as kopiegetalafwykings (CNA's), is die kopiegetalveranderings wat voortspruit uit somatiese mutasies, soos dié wat algemeen in kanker waargeneem word. Germline CNVs kan ook beskryf word as algemene of skaars gebaseer op hul bevolkingsfrekwensies. Hierdie vraestel spreek die probleem van opsporing van beide kiemlyn- en somatiese KNV'e aan en, in die besonder, van die verbetering van opsporingsensitiwiteit vir algemene KNV'e in beide kategorieë.

Met die dramatiese groei van volgordebepalingskapasiteit en die gepaardgaande daling in volgordebepalingskoste, bied massiewe parallelle volgende-generasie volgordebepaling aantreklike platforms vir genoomwye CNV-opsporing. Heel-genoom-volgordebepaling (WGS) bied 'n onbevooroordeelde genoomwye benadering om CNV's op te spoor, terwyl heel-eksoom-volgordebepaling (WES) en geteikende volgordebepaling die identifikasie van siekte-geassosieerde variante in koderende streke met direkte funksionele interpretasie moontlik maak. Ten spyte van die vinnige tegnologiese vooruitgang, staar CNV-opsporing met behulp van hoë-deurset-volgordebepaling steeds analitiese uitdagings in die gesig as gevolg van die deurdringende vooroordele en artefakte wat tydens biblioteekvoorbereiding en -volgordebepaling bekendgestel word. Behoorlike data normalisering is van kardinale belang, veral vir WES en geteikende volgordebepaling, waar tegniese vooroordele gewoonlik groottes groter is as CNV sein.

Vir studies waarin diep dekking van spesifieke genoomstreke verlang word [3,4,5], of waar die kohort van belang groot is, word WES en geteikende volgordebepaling dikwels verkies as goedkoper alternatiewe vir WGS. Byvoorbeeld, die DiscovEHR Collaboration (http://www.discovehrshare.com) het die eksome van meer as 50 000 deelnemers gerangskik, en die Exome Aggregation Consortium (ExAC http://exac.broadinstitute.org) het WES-data vir 60 706 saamgevoeg onverwante individue geneem uit veelvuldige siekte-spesifieke en bevolkingsgenetiese studies. Hierdie referaat is hoofsaaklik gemotiveer deur die uitdagings in WES en geteikende volgordebepalingdata, maar die metodes wat hier ontwikkel is, is ook geïntegreer in 'n CNV-opsporingspyplyn vir WGS-data [6], waar dit aangetoon word dat die normaliseringsmetodes wat hier voorgeskryf word meer akkurate moontlikheid maak. CNV-oproepe gebruik Mendeliaanse konkordansie as metrieke.

CNV-opsporing (deur WES en geteikende volgordebepaling) is hoofsaaklik gebaseer op die opsporing van plaaslike veranderinge in leesdekking langs die genoom. Hierdie ontledingskema is gebaseer op die eenvoudige intuïsie dat streke met kopiegetaltoename verhoogde leesdekking moet hê, en streke met kopiegetalverlies moet leesdekking verminder. Leesdekking hang egter nie net af van kopienommer nie, maar ook van baie ander faktore, soos GC-inhoud [7], karteerbaarheid [8] en ander plaaslike volgorde-eienskappe [9]. Daarom is leesdekking geneig om te wissel selfs wanneer daar geen CNV is nie en is dit veral veranderlik in WES en geteikende volgordebepalingdata as gevolg van die vooroordele en artefakte wat tydens die teiken- en versterkingstappe bekendgestel is [10,11,12].

Baie metodes is beskikbaar vir CNV-opsporing in hoë-deurset-volgordedata [10,11,12,13,14,15,16]. Ten spyte van baie vordering bly daar egter steeds beduidende uitdagings [17]. Onafhanklike maatstafresultate van veelvuldige studies [10, 12, 14, 18] toon dat bestaande metodes ly aan lae akkuraatheid en herroeptempo's, veral vir die opsporing van algemene kiemlyn CNV-seine. Hierdie resultate is nie onverwags nie, aangesien in WES- en geteikende volgordebepalingdata, en ook tot 'n mate in WGS-data, die tegniese agtergrondvooroordeel vir elke genomiese teiken oor monsters verskil, wat lei tot vals positiewe en negatiewe as dit nie behoorlik verwyder word nie. Om hierdie tegniese agtergrond te verwyder, het onlangse metodes staatgemaak op lae-dimensionele lineêre faktor modelle om die agtergrond vooroordeel vas te vang [10, 11], wat geneig is om te beheer vir vals positiewe. Hierdie lae-dimensionele lineêre faktormodelle is egter geneig om algemene KNV's te verwyder wat met die beraamde faktore korreleer. CLAMMS [19] is ontwikkel om algemene CNV-seine deur WES te herstel, maar is nie geskik vir kankermonsters nie, waar herhalende somatiese kopiegetalveranderings prominent is. In hierdie artikel demonstreer ons dat hierdie kwessie ook die opsporing van somatiese KNV's in kankergenome beïnvloed, aangesien KNV's wat herhaal word oor verskeie kankermonsters per ongeluk verwyder kan word in die normaliseringstap. As gevolg van hierdie beperkings, het huidige genetiese studies wat WES en geteikende volgordebepalingdata gebruik, hoofsaaklik gefokus op enkelnukleotiedvariasies en, op sy beste, seldsame CNV's [20,21,22].


Nonneman, D. J. et al. Genoomwye assosiasie van vleiskwaliteiteienskappe en sagtheid by varke. J Anim Sci 91, 4043–4050 (2013).

Luo, W. et al. Genoomwye assosiasie-analise van vleiskwaliteit-eienskappe in 'n vark Groot Wit x Minzhu-kruisingpopulasie. Int J Biol Sci 8, 580–595 (2012).

Serenius, T., Sevon-Aimonen, ML, Kause, A., Mantysaari, EA & Maki-Tanila, A. Genetiese assosiasies van vrugbaarheid met prestasie, karkas, vleiskwaliteit en beenbouvorm-eienskappe in die Finse Landras- en Grootwitvarkpopulasies . J Anim Sci 82, 2301–2306 (2004).

Ma, J. et al. Genoomwye assosiasiestudie van vleiskwaliteiteienskappe in 'n Wit DurocxErhualiaanse F2-kruising en Chinese Sutai-varke. PLoS One 8, e64047 (2013).

Sanchez, M.P. et al. 'n Genoomwye assosiasiestudie van produksie-eienskappe in 'n kommersiële populasie van Groot Wit varke: bewyse van haplotipes wat vleisgehalte beïnvloed. Genet Sel Evol 46, 12 (2014).

Ernst, C. W. & Steibel, J. P. Molekulêre vooruitgang in QTL-ontdekking en toepassing in varkteling. Tendense Genet 29, 215–224 (2013).

Heidt, H. et al. 'n Genetiese genomika-benadering openbaar nuwe kandidate en bevestig bekende kandidaatgene vir drupverlies in 'n varkhulpbronpopulasie. Mamm Genome 24, 416–426 (2013).

Zambonelli, P. et al. SNPs opsporing in DHPS-WDR83 oorvleuelende gene kartering op vark chromosoom 2 in 'n QTL streek vir vleis pH. BMC Genet 14, 99 (2013).

Duthie, C. A. et al. Kwantitatiewe eienskap loci vir vleis kwaliteit eienskappe in varke met inagneming van inprenting en epistatiese effekte. Vleiswetenskap 87, 394–402 (2011).

Hu, Z. L., Park, C. A., Wu, X. L. & Reecy, J. M. Animal QTLdb: 'n verbeterde databasis hulpmiddel vir lewendehawe diere QTL / assosiasie data verspreiding in die post-genoom era. Nukleïensure Res 41, D871–D879 (2013).

Soller, M., Weigend, S., Romanov, M. N., Dekkers, J. C. & Lamont, S. J. Strategieë om strukturele variasie in die hoendergenoom en sy assosiasies met biodiversiteit en biologiese prestasie te assesseer. Poult Sci 85, 2061–2078 (2006).

Schreiweis, M. A., Hester, P. Y. & Moody, DE. Identifikasie van kwantitatiewe eienskap lokusse wat verband hou met been eienskappe en liggaamsgewig in 'n F2 hulpbron populasie van hoenders. Genet Sel Evol 37, 677–698 (2005).

Xu, L. et al. Genoomwye CNV-analise toon bykomende variante wat met melkproduksie-eienskappe in Holsteins geassosieer word. BMC Genomics 15, 683 (2014).

Manolio, T. A. et al. Om die ontbrekende oorerflikheid van komplekse siektes te vind. Nature 461, 747–753 (2009).

Ionita-Laza, I., Rogers, A. J., Lange, C., Raby, B. A. & Lee, C. Genetiese assosiasie-analise van kopie-nommervariasie (CNV) in menslike siektepatogenese. Genomics 93, 22–26 (2009).

Fanciulli, M. et al. FCGR3B-kopiegetalvariasie word geassosieer met vatbaarheid vir sistemiese, maar nie orgaanspesifieke, outo-immuniteit nie. Nat Genet 39, 721–723 (2007).

Sebat, J. et al. Sterk assosiasie van de novo kopiegetalmutasies met outisme. Science 316, 445–449 (2007).

Walsh, T. et al. Rare structural variants disrupt multiple genes in neurodevelopmental pathways in schizophrenia. Science 320, 539–543 (2008).

Yang, Y. et al. Gene copy-number variation and associated polymorphisms of complement component C4 in human systemic lupus erythematosus (SLE): Low copy number is a risk factor for and high copy number is a protective factor against SLE susceptibility in European Americans. Am J Hum Genet 80, 1037–1054 (2007).

Xu, L. Y. et al. A genome-wide survey reveals a deletion polymorphism associated with resistance to gastrointestinal nematodes in Angus cattle. Funct Integr Genomic 14, 333–339 (2014).

Hou, Y. L. et al. Analysis of copy number variations in Holstein cows identify potential mechanisms contributing to differences in residual feed intake. Funct Integr Genomic 12, 717–723 (2012).

Luo, J. et al. Genome-wide copy number variant analysis in inbred chickens lines with different susceptibility to Marek’s disease. G3 3, 217–223 (2013).

Wang, X. & Byers, S. Copy Number Variation in Chickens: A Review and Future Prospects. Microarrays 3, 24–38 (2014).

Karyadi, D. M. et al. A Copy Number Variant at the KITLG Locus Likely Confers Risk for Canine Squamous Cell Carcinoma of the Digit. Plos Genet 9, e1003409 (2013).

Jiang, J. C. et al. Global copy number analyses by next generation sequencing provide insight into pig genome variation. Bmc Genomics 15, 593 (2014).

Ramayo-Caldas, Y. et al. Copy number variation in the porcine genome inferred from a 60 k SNP BeadChip. BMC Genomics 11, 593 (2010).

Chen, C. Y. et al. A comprehensive survey of copy number variation in 18 diverse pig populations and identification of candidate copy number variable genes associated with complex traits. BMC Genomics 13, 733 (2012).

Paudel, Y. et al. Evolutionary dynamics of copy number variation in pig genomes in the context of adaptation and domestication. BMC Genomics 14, 449 (2013).

Wang, J. Y. et al. A genome-wide detection of copy number variations using SNP genotyping arrays in swine. BMC Genomics 13, 273 (2012).

Wang, J. Y. et al. Identification of Genome-Wide Copy Number Variations among Diverse Pig Breeds Using SNP Genotyping Arrays. Plos One 8, e68683 (2013).

Wang, L. G. et al. Genome-Wide Copy Number Variations Inferred from SNP Genotyping Arrays Using a Large White and Minzhu Intercross Population. Plos One 8, e74879 (2013).

Abyzov, A., Urban, A. E., Snyder, M. & Gerstein, M. CNVnator: An approach to discover, genotype and characterize typical and atypical CNVs from family and population genome sequencing. Genome Res 21, 974–984 (2011).

Wimmers, K. et al. QTL for microstructural and biophysical muscle properties and body composition in pigs. BMC Genet 7, 15 (2006).

Edwards, D. B. et al. Quantitative trait locus mapping in an F2 Duroc x Pietrain resource population: II. Carcass and meat quality traits. J Anim Sci 86, 254–266 (2008).

Choi, I. et al. Identification of Carcass and Meat Quality QTL in an F(2) Duroc x Pietrain Pig Resource Population Using Different Least-Squares Analysis Models. Front Genet 2, 18 (2011).

Estelle, J. et al. A quantitative trait locus genome scan for porcine muscle fiber traits reveals overdominance and epistasis. J Anim Sci 86, 3290–3299 (2008).

van Wijk, H. J. et al. Identification of quantitative trait loci for carcass composition and pork quality traits in a commercial finishing cross. J Anim Sci 84, 789–799 (2006).

Lappas, M. NOD1 expression is increased in the adipose tissue of women with gestational diabetes. J Endocrinol 222, 99–112 (2014).

D’Angelo, G., Rega, L. R. & De Matteis, M. A. Connecting vesicular transport with lipid synthesis: FAPP2. Bba-Mol Cell Biol L 1821, 1089–1095 (2012).

Ramkhelawon, B. et al. Netrin-1 promotes adipose tissue macrophage retention and insulin resistance in obesity. Nat Med 20, 377–384 (2014).

Ramayo-Caldas, Y. et al. Genome-wide association study for intramuscular fatty acid composition in an Iberian x Landrace cross. J Anim Sci 90, 2883–2893 (2012).

Dowler, S. et al. Identification of pleckstrin-homology-domain-containing proteins with novel phosphoinositide-binding specificities. Biochem J 351, 19–31 (2000).

Llambi, F., Causeret, F., Bloch-Gallego, E. & Mehlen, P. Netrin-1 acts as a survival factor via its receptors UNC5H and DCC. Embo Journal 20, 2715–2722 (2001).

Xu, L., Hou, Y., Bickhart, D., Song, J. & Liu, G. Comparative Analysis of CNV Calling Algorithms: Literature Survey and a Case Study Using Bovine High-Density SNP Data. Microarrays 2, 171–185 (2013).

Korn, J. M. et al. Integrated genotype calling and association analysis of SNPs, common copy number polymorphisms and rare CNVs. Nat Genet 40, 1253–1260 (2008).

Aulchenko, Y. S., de Koning, D. J. & Haley, C. Genomewide rapid association using mixed model and regression: A fast and simple method for genomewide pedigree-based quantitative trait loci association analysis. Genetics 177, 577–585 (2007).

Amin, N., van Duijn, C. M. & Aulchenko, Y. S. A genomic background based method for association analysis in related individuals. PLoS One 2, e1274 (2007).

Gao, X. Y., Stamier, J. & Martin, E. R. A multiple testing correction method for genetic association studies using correlated single nucleotide polymorphisms. Genet Epidemiol 32, 361–369 (2008).

Barrett, J. C., Fry, B., Maller, J. & Daly, M. J. Haploview: analysis and visualization of LD and haplotype maps. Bioinformatics 21, 263–265 (2005).

Gabriel, S. B. et al. Die struktuur van haplotipe blokke in die menslike genoom. Science 296, 2225–2229 (2002).

Du, F. X., Clutter, A. C. & Lohuis, M. M. Characterizing linkage disequilibrium in pig populations. Int J Biol Sci 3, 166–178 (2007).

Ballester, M., Castello, A., Ibanez, E., Sanchez, A. & Folch, J. M. Real-time quantitative PCR-based system for determining transgene copy number in transgenic animals. Biotechniques 37, 610–613 (2004).

Livak, K. J. & Schmittgen, T. D. Analysis of relative gene expression data using real-time quantitative PCR and the 2(T)(-Delta Delta C) method. Methods 25, 402–408 (2001).

Graubert, T. A. et al. A high-resolution map of segmental DNA copy number variation in the mouse genome. Plos Genet 3, e3 (2007).

Li, H. & Durbin, R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics 25, 1754–1760 (2009).

Li, H. et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics 25, 2078–2079 (2009).

Huang, D. W., Sherman, B. T. & Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nat Protoc 4, 44–57 (2009).

Ashburner, M. et al. Gene Ontologie: hulpmiddel vir die eenwording van biologie. Nat Genet 25, 25–29 (2000).

Kanehisa, M., Goto, S., Furumichi, M., Tanabe, M. & Hirakawa, M. KEGG for representation and analysis of molecular networks involving diseases and drugs. Nucleic Acids Res 38, D355–D360 (2010).


Agtergrond

The fraction of genomic variation attributable to copy number variants (CNVs) is larger than single nucleotide polymorphisms (SNPs) and yet the full extent of such structural variation is still relatively unexplored [1, 2]. CNVs involve duplications, deletions or insertions of DNA segments up to several megabases in length and are responsible for significant phenotypic variation [3]. In humans, the frequency distribution of CNVs shows signals of purifying selection, suggesting that a significant proportion of CNVs have harmful phenotypic effects [1]. CNVs are associated with a number of genetic disorders, including Crohn's disease [4], psoriasis [5], osteoporosis [6], glomerulonephritis [7] and systemic lupus erythematosus [8]. However, there are also a small number of examples of CNVs that may be beneficial, such as adaptive variation in copy number of the amylase gene in response to diet [9], and variation in HIV/AIDS susceptibility [10].

A variety of mechanisms are thought to give rise to CNVs [11]. A major source of structural variation is non-allelic homologous recombination (NAHR), which occurs due to aberrant pairing of regions of extended homology. Other mechanisms involve re-joining of breaks in DNA but do not require extensive homology. In addition to this, errors in replication, such as slippage at variable number of tandem repeat (VNTR) loci or insertion of transposable elements, also generate variation in copy number. CNV formation appears to occur at higher rates in certain genomic regions termed rearrangement hotspots. In particular, CNVs associated with NAHR tend to be clustered in the genome, and CNVs are enriched in the vicinity of segmental duplications. This suggests regions of local sequence homology are hotspots of CNV formation by NAHR [12–14]. In humans, the initiation of meiotic double-stranded breaks (DSBs) is thought to begin with the binding of the protein PRDM9 to a degenerate 13-bp sequence motif [15–17]. This motif is also enriched in CNV breakpoints [2], including several involved in disease [18], which implicates DSBs formed in this way in CNV formation by NAHR.

Domestic dogs harbor an astonishing level of phenotypic variation, which is mostly apportioned into distinct breeds. The hundreds of dog breeds recognized today were formed by population bottlenecks accompanied by strong artificial selection, which has led to both their unique collections of characteristics and an increased prevalence of genetic disease. This makes the dog an ideal genetic model for uncovering the genetic basis of normal and pathogenic phenotypic variation [19]. Many traits have now been mapped in the dog genome using a variety of approaches [19–22], and structural variation is implicated in a number of these. For example, a duplication of three fibroblast growth factor (FGF) genes causes the dorsal hair ridge in Rhodesian and Thai Ridgeback dogs and predisposes to dermoid sinus [23], a duplication upstream of Hyaluronic acid synthase 2 (HAS2) is responsible for the characteristic wrinkled skin of Chinese Shar-Pei dogs and predisposes to periodic fever syndrome [24], and an insertion of an FGF4 retrogene is responsible for chondrodysplasia typical of certain breeds [25]. As in humans, much phenotypic variation is likely to be attributable to CNVs, which makes investigating them important for uncovering the genetic basis of phenotypic variation in dogs.

There is a possibility that the genomic features that promote CNV formation in dogs differ from other mammals. The dog genome differs from the majority of other mammals in that it lacks an active copy of PRDM9, which suggests that formation of meiotic DSBs is controlled differently in dogs [26]. A fine scale analysis of recombination rate variation in the dog genome indicated that, like in humans, recombination is clustered into hotspots but that, unlike in humans, these regions were strongly enriched for short regions (approximately 1 kb) of highly elevated GC content (GC peaks) [27]. This suggests GC peaks may be targets of meiotic DSBs. Interestingly, GC rich regions also seem to be involved in genome rearrangements during canid genome evolution, where they have relocated to telomeric regions [28]. This could indicate that GC peaks are important targets of NAHR and often involved in rearrangements.

Three studies have identified canine CNVs using array comparative genomic hybridization (aCGH) [29–31]. Chen et al. [29] used a 385,000 oligo array on nine dogs from different breed groups. They discovered 155 high confidence CNVs in 60 CNV regions. Nicholas et al. [30] focused on areas of segmental duplications (SDs) using single dogs from 17 breeds and a gray wolf and identified approximately 3,600 CNVs in approximately 700 overlapping regions found in two or more samples. A subsequent study [31] used aCGH with 2.1 million probes with an average density of 1 kb in nine dogs and one wolf sample and identified 403 CNVs. As expected, CNVs were found to be enriched in SDs. It was also shown that CNVs not associated with SDs were more likely to be present only once or at lower frequencies in the dataset. An additional population genetic analysis on a set of these CNVs revealed some with divergent patterns of fixation in different breeds, which could be responsible for breed-specific traits.

Despite extensive efforts to type CNVs in dogs, several questions remain about their mechanisms and effects. There is evidence that meiotic DSBs localize to different sites in dogs than other mammals [27] does this cause a different distribution of CNVs in the genome? Is there evidence of fixed CNVs in certain breeds that may lead to breed-specific phenotypes? Can variation at CNV loci be used to delineate different breeds? Besides these questions, a comprehensive catalogue of dog CNVs would be useful to aid gene-mapping studies. Here we present the most comprehensive CNV discovery effort in dogs to date. We use a 2.1 million-probe array, as in Nicholas et al. [31], with probes spaced on average of 1 kb. We investigate the genome-wide extent and characteristics of CNVs in 50 dogs from 17 breeds and 3 wolves. This enables us to examine sequence features in breakpoints at high resolution and determine patterns of fixation.


This work was supported by the University of Chicago (L.Y.), NCI grant K22CA193848 (L.Y.), Cancer Research Foundation Young Investigator Award (L.Y.), American Cancer Society Institutional Research Grant IRG-16-222-56 (L.Y.), NCI Cancer Center Support Grant P30CA14599 (L.Y.), and the Harvard Ludwig Center (P.J.P.).

Affiliasies

Ben May Department for Cancer Research and Department of Human Genetics, The University of Chicago, Chicago, IL, USA

Department of Biomedical Informatics, Harvard Medical School, Boston, MA, USA

Su Wang, Jake June-Koo Lee, Semin Lee, Eunjung Lee & Peter J. Park

Ludwig Center at Harvard, Boston, MA, USA

Jake June-Koo Lee & Peter J. Park

Department of Molecular and Human Genetics, Baylor College of Medicine, Houston, TX, USA

Eve Shinbrot & David A. Wheeler

Division of Genetics, Brigham and Women’s Hospital, Boston, MA, USA

Raju Kucherlapati & Peter J. Park

Department of Genetics, Harvard Medical School, Boston, MA, USA

Present Address: Department of Biomedical Engineering, Ulsan National Institute of Science and Technology, Ulsan, South Korea

Present Address: Division of Genetics and Genomics, Boston Children’s Hospital, Boston, MA, USA

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Bydraes

LY designed the experiments, developed the original concepts, and contributed to new informatic methods. LY, SW, JJL, SL, EL, and ES performed the data processing and analysis. LY, DW, RK, and PJP supervised the project. LY and PJP interpreted the results and wrote the manuscript. Alle skrywers het die finale manuskrip gelees en goedgekeur.

Ooreenstemmende skrywers


Erkennings

This work was supported by National Institutes of Health grants HL65962. The authors would like to acknowledge Robert Woodhall and Nila Gillani for their contributions to the genotyping.

Financial & competing interests disclosure

The authors have no relevant affiliations or financial involvement with any organization or entity with a financial interest in or financial conflict with the subject matter or materials discussed in the manuscript. This includes employment, consultancies, honoraria, stock ownership or options, expert testimony, grants or patents received or pending, or royalties.

No writing assistance was utilized in the production of this manuscript.


Kyk die video: वरट क शद अनषक स कय हई - Ex RAW NK Sood (September 2022).