Inligting

Persoonlike genomiese datamonsters

Persoonlike genomiese datamonsters


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

'n vinnige vraag. Ek is op soek na volledige persoonlike genomiese data van menslike individue. Die enigste vereiste vir die genomiese data is dat dit die volledige stel SNP's van 'n menslike individu bevat. Tot dusver het ek net een gevind, 'n Spaanse wyfie.

Is daar soortgelyke persoonlike genomiese data op die internet beskikbaar? Is daar 'n databasis waartoe ek toegang kan verkry met 'n versameling SNP's per individu?


Hier is die skakel na die 1000 Genomes-projek, al die data is beskikbaar vir aflaai. Hulle het reeds 'n omvattende lys van SNP's ook. Dit is nie die enigste projek op die oomblik nie, maar dit is beslis die een met meer akkurate data oor so baie genome.


'N Ander bron sou die Simons Genome Diversity Project wees wat deur Mallick et al. in 2016. Hierdie stel dek veel meer bevolkings as die 1000 genome, en bevat dus meer algemene menslike genetiese diversiteit, maar het ook slegs 'n paar individue per bevolking (en populasies oorvleuel nie met 1000 genome sover ek weet nie).

Watter databasis vir u die beste is, hang af van die werklike vraag.


Die Persoonlike Genoom Projek

Groot potensiële voordele vir sisteembiologie lê in toepassings op menslike gesondheid en identiteit. Om ons gemeenskap se vaardighede in hierdie rigtings te ontwikkel, gereed toegang tot hoogs geïntegreerd en omvattend datastelle van menslike genoom en fenoom is uiters belangrik en tegnies toenemend haalbaar. Die min menslike 'funksionele genomika' datastelle wat vandag beskikbaar is, is geneig om van mekaar geïsoleer te word. Sommige van die hulpmiddels wat nodig is om hierdie impasse te deurbreek, word hieronder behandel in die konteks van 'n Personal Genome Project (PGP) as 'n natuurlike opvolger van die Human Genome Project (HGP) - twee onlangse knoppe op die ou gebied van genetika.

Vanaf my eerste interaksie met Wally Gilbert in 1976, het dit gelyk asof 'n groot (maar aantreklike) sprong sou wees om van sy nuwe metode om 30 bp -segmente te volg, na 'n metode te gaan om almal se volledige genoom te volg. Ses biljoen basispare vir ses biljoen mense het 'n goeie klank gehad. Dit was nog steeds bloot 'n fantasie toe ons 'n referaat genaamd 'Genomic Sequencing' in 1984 gepubliseer het (Church en Gilbert, 1984) en saamgesweer het om 'n 3 miljard dollar HGP later daardie jaar te skep (Cook-Deegan, 1989). Vir die daaropvolgende 16 jaar was radikale tegnologie-ontwikkeling (terwyl dit in 'n paar 'agterkamers' aan die lewe gehou is) duidelik 'n geringe befondsingsprioriteit relatief tot 'produksie'-volgordebepaling. Teen 2001 het die kritiek op die ou tegnologie egter toegeneem en die oproep vir bekostigbare persoonlike genome het onweerstaanbaar geword (Jonietz, 2001). Vroeg in 2004 het die NIH-NHGRI 'n versoek vir aansoeke geplaas, en in Oktober 2004 en Augustus 2005 het toekennings van altesaam $70 miljoen aangekondig vir tegnologie wat lei tot menslike genoomvolgordes vir $100 000 in 5 jaar en $1000 in 10 jaar (http:/ /www.nih.gov/news/pr/aug2005/nhgri-08.htm). Asof die motivering nog nie hoog genoeg was nie, tydens die onlangse Genome Sequencing & Analysis Conference in Hilton Head (18 Oktober), het die vooruitsig van 'n nuwe X-prys ontstaan ​​om hierdie nuwe veld van Personal Genomics aan te moedig. (Die eerste X-prys, $ 10 miljoen vir herbruikbare ruimtetuie, is op 4 Oktober 2005 toegeken en word gevolg deur 'n $ 50 miljoen-prys vir wentelbaan.) Te midde van al hierdie positiewe versterking, is 'n paar belangrike punte vaag-wat presies word bedoel met die volgorde van 'n menslike genoom? Wat is die nut van persoonlike genome? Wat is die etiese, regs- en sosiale implikasies (ELSI)? Die tyd het aangebreek om hierdie punte op te skerp. Terwyl ons begin om persoonlike genome te koop, wil ons weet waarvoor ons betaal.

Wat word bedoel met die volgorde van 'n menslike genoom? Om vordering in hierdie veld kwantitatief te evalueer, benodig ons ingenieurspesifikasies vir die kwaliteit en koste van genome en praktiese maniere om vordering te standaardiseer en te valideer. Die kwaliteit van genome kan bepaal word deur die fraksie van die genoom wat in volgorde geplaas is en die akkuraatheid van daardie bedekte streke. Beide hierdie maatreëls het nuanses. Die fraksie van die genoom kan van die hele genoom of net die proteïenkodering of net die euchromatiese streke wees. In ons huidige tempo van ontdekking van nuwe genetiese elemente en verskynsels wat menslike gesondheid kan beïnvloed, is hoe naby ons aan 'n hele genoomvolgorde kan kom wat ons wil meet. Die kwaliteit kan 'n invoeging of verwydering van 4 bp as een fout of vier foute tel. Eersgenoemde lyk na 'n geskikte maatstaf vir herhaling van tandem. 'N Verkeerde' kruising 'van een haplotipe na 'n ander sal as 'n enkele fout tel eerder as om alle stroomafwaartse foute op te tel. 'N Individuele genoom kan binne 1E -3 geraam word bloot deur te raai dat die individu dieselfde is as die hodgepodge HGP -genoom wat tans in GenBank is. Dit kan raai tot binne 1E -4 deur af en toe SNP's te gebruik om ongeveer 10 kb van gekoppelde algemene SNP's in te sleep. 'N Foutkoers van 1E − 4 beteken egter dat daar 600 000 foute in 'n diploïede menslike genoomvolgorde sal wees, wat elk addisionele volgorde- of funksionele toetse benodig (meer basispaarfoute as 'n hele genoom). Die genomiese verskille tussen 'n kankersel en 'n normale sel kan ongeveer 1E -6 per basispaar wees (Wang, 2004) (slegs 'n paar van die veranderinge veroorsaak die patologiese verspreiding). So 'n redelike X-prys-uitdaging sou wees om 100 diploïede (en sommige aneuploïede) menslike genome teen dieselfde dekking en akkuraatheid as vandag se haploïede mosaïek te volgorde, dit wil sê 99% van die euchromatien en 93% van die hele genoom teen 'n foutkoers beter as 1E − 6. Die resultate kan deur die ander spanne nagegaan word met behulp van 'n gedeelde stel DNA's (sien bespreking van sellyne hieronder).

Die nut van die eerste persoonlike genoom is analoog aan die eerste faksmasjien, webbladsy of rekenaar. Totdat die gemeenskappe van hulpbronne opbou, dien hierdie revolusionêre nuwe gereedskap hoofsaaklik die 'vroeë aanvaarders'. Hierdie aanvanklike deelnemers is helde en proefkonies wat die weg baan vir 'n groter potensiaal vir die algemene publiek. Vir persoonlike genomika sien ons reeds markaktiwiteite in genetiese siektes, kanker en farmakogenomika, byvoorbeeld toetse vir BRCA1/2, EGFR wat 'n invloed het op diagnostiek en keuse van medisyne en dosis. Dit brei vinnig uit om persoonlike voeding en lewensstylbesluite in te sluit. Aangesien DNA slegs 'n klein deel van die lot is, kan persoonlike genomika 'voorspelling' met vrug ontneem en fokus op die uitbreiding van sisteembiologie-interpretasies en prioritisering van werklike dag-tot-dag metings van ons fisiologiese toestande (Hood et al, 2004). Selfs voordat die PGP heeltemal gereed is vir mediese praktyk, sal dit navorsing oor menslike funksionele genomika en stelselbiologie help. Hierdie onderwerpe benodig die perspektief van inter-individuele variasie (Cheung, 2005). 'N Stelselmodel wat 'n kanonieke sel of konsensussel beskryf, is nie so insiggewend as 'n model wat ook natuurlike genetiese variasie en epigenetiese stochastiek omhels nie.

Wat sou ons doen as ons môre ons volle genoom kry? Ons rangskik eers ons 6 miljoen verskille ten opsigte van 'n verwysingsgenoom, op soek na mutasies wat (a) bekende siekte -gene beïnvloed (of gene wat verband hou met funksie of homologie), (b) behoue ​​genetiese elemente beïnvloed (Ramensky, 2002 Vitkup, 2003) , en/of (c) homosigotiese of (mede) dominante allele skep. Vervolgens genereer ons hipoteses oor moontlike gevolge van die top -veranderings, insluitend die aanpassing van bestaande stelselmodelle. Dan wil ons hierdie hipoteses toets met gefokusde bevolkingsverenigingsstudies, dieremodelle en funksionele genomika op die selle van die PGP -proefpersone. Die resultate van hierdie studies sal ons toelaat om kliniese diagnostiek, terapieë, lewenstyl en voedingsveranderinge persoonlik beter te prioritiseer.

Wat is die ELSI van persoonlike genomika? Alhoewel dit maklik is om meegevoer te word deur die opwinding van die tegnologie, moet ons ook vra wat nodig is om dit te help om positief in die samelewing uit te speel. Sal die aanvaarding vinnig wees, soos die wêreldwye web in 1993, of gaan dit deur 'n reeks groot terugslae soos met geneties gemodifiseerde organismes? Twee belangrike kwessies wat ter sprake kom, is privaatheid en versekering. Eerstens, privaatheid. 'n Ideale stelselbiologie-hulpbron sou 'n hoogs geïntegreerde datastel vir alle aspekte van menslike fenotipe vir 'n geneties diverse stel vakke wees. Dit sal volledige mediese rekords, omics-data en moontlike identifiserende data soos kraniofasiale MRI en 3D-fotogrammetrie insluit. Gesigskenmerke is een van die mees opvallende en sosiaal betekenisvolle menslike fenotipes. Om hulle met genotipes te korreleer is van groot belang vir forensiese en sekuriteitstoepassings en sal vroeë visualisering van positiewe en negatiewe gebruike aanmoedig. Navorsing oor menslike onderwerpe, veral as die identifikasie onprakties is (soos hierbo), verg nie net die Institutional Review Board (IRB) se goedkeuring vir die insameling van die data nie, maar ook om toegang daartoe te verkry. Soms wyk navorsers af van die ingediende IRB -planne of ontwyk die IRB heeltemal, wat die risiko van verlies aan befondsing, verlies aan toegang tot kliniese hulpbronne en moontlike skade aan die proefpersone aan die risiko stel. Dit is duidelik baie meer voordelig om die volledige studieplan vooraf aan die IRB en die publiek te kommunikeer om breër gevolge te vang as wat enkele navorsers tipies dink (Kennedy, 2002 Church, 2005a).

Hoe meer gewild die PGP-genoom- en fenoomdata in die algemeen versprei is, hoe groter is die kans dat toevallige of doelbewuste vrystelling na 'n openbare deel van die internet (en Google) of heridentifisering (Kohane en Altman, 2005) plaasvind. As die proefpersone instem met die belofte van permanente vertroulikheid van hul rekords, kan die blootstelling van hul data lei tot sielkundige trauma vir die deelnemers en verlies aan openbare vertroue in die projek. Aan die ander kant, as onderwerpe gewerf en toegestem word op grond van die verwagting van volledige openbare data, kan die bogenoemde risiko's vir die vakke en die projek vermy word. Hoeveel vrywilligers bereid is om aanvanklik deel te neem en hoeveel die studie uitbrei (elkeen let op die kumulatiewe ervarings van die vroeëre deelnemers) is wat ons PGP-ELSI-vraag #1 kan noem. Die fraksie mense wat bereid is om vrywillig te werk, kan ons verras. Net soos pioniers, gesondheidswerkers en ruimtevaarders, sal hulle hulself (en hul gesinne) in gevaar stel, maar met belonings vir die samelewing (en hul gesinne). Die aantal persoonlike feite wat as stigmatisering beskou word, daal sedert die 1960's toe kanker, depressie, seksuele disfunksie en seksueel oordraagbare siektes taboe was, terwyl bespreking van persoonlike besluite oor Iressa, Viagra, Prozac en AZT vandag gereeld voorkom. Die sleutelpunt is dat 'n oop-PGP moontlik tot duisende vakke kan skaal sonder om op perfekte datasekuriteit staat te maak, en of dit wel sal is nie 'n teoretiese vraag nie. Aangesien volle blootstelling 'n nuwe konsep is, sal die PGP ELSI -navorsing stimuleer wat breër implikasies ondersoek, insluitend versekering, diskriminasie op die werkplek en profilering.

Hoe verminder ons die risiko vir die deelnemers? Die aanvanklike deelnemers moet uiteenlopend wees, maar tog baie vertroud wees met navorsing oor menslike onderwerpe, genetika, inligtingstegnologie en ELSI. Hulle moes 'n verskeidenheid van die ergste scenario's deeglik oorweeg het. Die onderwerp sou ideaal (en ook naaste familielede) nie huiwer om enige deel van die genoom van die onderwerp of persoonlike gesondheidsrekords van die onderwerp te ken en te deel nie (Sands en Halamka, 2004 Kohane en Altman, 2005). 'n ander deel skrikwekkend op 'n later datum (nadat dit te laat is om die data van die publieke domein te verwyder). Die doel van die PGP moet wees om die aantal en diversiteit van deelnemers stadig te verhoog, insluitend uitreik- en breë gehoorgenetika-opvoeding. In elke stadium sal 'n Dataveiligheidsmoniteringskomitee die behoefte aan staking of regstellings in die middel van die kursus evalueer. Die aanvanklike vertroue kan groter wees as die PGP 'n nie-winsgewende entiteit is wat nou verbonde is aan mediese skole en onderwyshospitale, eerder as 'n kommersiële onderneming. Om die vertroue verder te verhoog, sal PGP -vraag #2 wees of dit moontlik is om deelnemers (buiten hul normale gesondheids-, lewens- en werkversekering) spesifiek te beskerm teen genetiese diskriminasie (Geller et al, 1996) as gevolg van die PGP-studie self. Sommige aanvanklike deelnemers is moontlik gesonde senior genetici en het dus 'n lae risiko om verras te word, maar in die belang van veralgemenbaarheid moet vakke ook gekies word om nader aan die normale risikovlakke te wees. Nietemin kan die PGP-versekeringsfonds steeds 'prakties' wees aangesien dit nie onmiddellik 'winsgewend' hoef te wees nie. Dit kan skenkings benut, moontlik insluitende deelname van versekeringsmaatskappye wat 'n moontlike seeverandering erken.

Wat gebeur as proefpersone leer oor aanleg vir siektes sonder genesing? Een klassieke benadering tot hierdie probleem was om die data vir die onderwerp te verberg. 'n Alternatief is dat die proefpersone kundige voorstanders kan word vir navorsing oor die siekte wat hul gesinne teister. Bekende voorbeelde hiervan is Augusto Odone (adrenoleukodystrophy en Lorenzo se olie), Doug Melton (diabetes en die Harvard Stamselinstituut), Nancy Wexler (Huntington -siekte) en Mike Milken (prostaatkanker). Dit is dalk PGP vraag #3.

Opskaling van genetiese epidemiologie. Aanvanklik sal die PGP 'n klein aantal deelnemers hê en kan dit dus fokus op die hipotese-generasie en die selgebaseerde toetsing wat hierbo beskryf is. Epidemiologiese en genetiese assosiasiestudies sal baat by duisende of selfs miljoene deelnemers, en 'n vroeë suksesvolle PGP-ervaring kan nuwe studie-ontwerpopsies vir multisiekte-studies oor groot populasies soos die Nurses Health Study en Health Professionals 'Follow-up Study (Forman, 2005). Radikaal nuwe sosiale en sakemodelle vir die deel van data kan na vore kom, soortgelyk aan peer-to-peer-, wiki- en blogverskynsels. Vraag 4 van die PGP — Watter nuwe sagteware kom om die 'openheid' van die PGP te benut wat nie van toepassing was op vorige (geslote) studies nie (of nie) nie? Sodra dit goedgekeur is vir publikasie deur die primêre IRB, sou die PGP -data beskikbaar wees vir verdere navorsing, net soos alle ander publieke domeindata sonder heraansoek deur ander IRB's. Daar kan met sagteware -ontwikkelaars en gebruikers gekontak word om die impak wat hulle van so 'n beleid voel, te beoordeel.

Om die nuwe tegnologieë te standaardiseer en te bekragtig, benodig ons standaard genomiese DNA (en ander molekules en selle) van 'n betroubare, hernubare bron, dit wil sê, sellyne. Ideaal gesproke sou hierdie selle ooreenstem met individue wat deelneem aan 'n IRB-goedgekeurde 'oop' projek soos die PGP. Die industrie-standaard vir genomiese hulpbronne is 'n EBV-getransformeerde B-sellyn. Die PGP het 'n samewerking met die Coriell NIGMS-bewaarplek geïnisieer om gemeenskapstoegang te bied tot die selle en DNS wat ooreenstem met elke PGP-vrywilliger (Church, 2005a). Om te help met die insameling van transkriptoom- en proteoomdata uit 'n verskeidenheid seltipes vir elke individu, sou 'n pluripotente sellyn ook uiters nuttig wees (Hwang, 2005). Hierdie selle verteenwoordig die samesmelting van analitiese en sintetiese (Church, 2005b) gereedskap aan die voorpunt van persoonlike medisyne, waar histokompatibele stamselle vir elke individu vasgestel word en voor volledige gebruik gekontroleer word op volledige genomiese en epigenomiese kwaliteit.

Samevattend, biologiese en mediese navorsing benodig nie net nuwe 'omika'-tegnologie en -stelselmodelle nie, maar ook nuwe maniere om tegnologie te assesseer en om laerisiko, 'oop', geïntegreerde datastelle wat op inter-individuele variasie gefokus is, te verkry. Die PGP en sulke projekte is aan die gang en sal waarskynlik verander en diversifiseer in reaksie op 'n verskeidenheid insette.


Ons moet praat oor big data en genomika. Hier is hoekom – en hoe

In 'n era wanneer die meeste van ons persoonlike data in die digitale eter het, bly toestemming, privaatheid en beskerming steeds grys areas. Baie van ons gee of deel ons data, dikwels sonder om te besef in watter mate ons dit doen. Selfs al is dit uitdruklik in die bepalings en voorwaardes, hoeveel van ons kan daarop aanspraak maak om dit volledig te lees? Kan ons dus regtig seker wees dat ons data versigtig hanteer word?

Alhoewel daar regulasies bestaan ​​om ons te beskerm (byvoorbeeld die General Data Protection Regulation (GDPR) in Europa, of die Wet op die Beskerming van Persoonlike Inligting (POPI) in Suid -Afrika), is daar steeds 'n verband tussen hierdie gedragskodes en die alledaagse persoon, met min bewyse dat daar 'n openbare konsultasie in die ontwikkeling was.

Het jy gelees?

Wat beteken dit in terme van ons genomiese data?

Genomika (die studie van ons gene, wat uit DNA bestaan) word 'n belangrike bron van data binne die meeste dissiplines van gesondheidsorg. As ons bloed skenk, aan genetiese navorsing deelneem of 'n aanlyn genetiese toets doen, sal ons genomiese data aansluit by die verskeidenheid persoonlike data wat reeds aanlyn en vanlyn oor ons gehou word. Dit bied 'n ryk bron van insig oor menslike gesondheid en word soms op groot skaal gekoop, verkoop en gedeel tussen navorsers (nie-winsgewend en winsgewend), op 'n manier wat dikwels onbekend is vir die persoon wat die data geskenk het. Of natuurlik, alles wat met ons genomiese data gebeur, moet slegs met ons toestemming gedoen word, maar weereens - hoeveel van ons lees eintlik die bepalings en voorwaardes?

Hoe ontwikkel ons regulasies wat dataskenkers beskerm?

Om regulering werklik verbind te word met diegene wat dit dien om te beskerm, moet dit die standpunte en bekommernisse van die publiek sowel as diegene van wie die DNA -data verkry word (dit wil sê die 'datadonateurs') weerspieël. Vir mense om gehoor te word, moet ons die regte vrae aan hulle begin stel en hul antwoorde teruggee aan beleidmakers.

As sodanig is die eerste belangrike vrae: Hoe voel mense dat hul genomiese data met ander gedeel word? Hoeveel beheer verwag hulle om hieroor te hê? Is daar sekere organisasies wat hulle nie toegang tot hul data wil hê nie? Wat dink hulle sal gebeur as hulle uit hul data geïdentifiseer word?

Maar voordat mense kan antwoord, moet hulle tyd kry om na te dink oor die kwessies en tyd te hê om na te dink, te bespreek en hul eie vrae te stel. Dit verg belegging van wetenskaplikes en beleidmakers om te verduidelik wat dit alles beteken.

DNS (genomiese data) word soms gesien as die suiwerste en mees persoonlike soort data, fundamenteel tot ons identiteit en bestaan. As deel van die wêreldwye poging om menslike gesondheid te verstaan ​​en lyding aan te spreek, sou ons met reg verwag dat ons wetenskaplikes, klinici en akademiese instellings ons DNA en mediese inligting in die konteks versamel, stoor, ontleed en tot 'n mate deel. van navorsing en ontdekking.En in ruil daarvoor is dit redelik om te verwag dat die data wat die kern van hierdie poging is, beskerm, versorg en veral deursigtig en met respek hanteer word.

Alhoewel data gede-identifiseer kan word – dit wil sê met name en adresse verwyder – is 'n kwessie waarvan mense bewus moet wees dat anonimiteit nie absoluut gewaarborg kan word nie. Gesondheidsinligting kan byvoorbeeld altyd gekoppel word aan ander persoonlike inligting wat ook op die web beskikbaar is – en in ons toenemend data-gekoppelde wêreld word dit heeltemal haalbaar dat mense, in teorie, uit hul DNA alleen geïdentifiseer kan word. Gee mense om? Wat kan gebeur? Dit is die gesprekke wat ons gesamentlik moet voer. Dit is onmoontlik om volmaaktheid te verwag. Geen regulering is absoluut nie. Geen data is 100% veilig nie. En enigiemand wat anders sê, is oorbelowend. As skenkers van data moet ons aanvaar dat daar altyd risiko's is, maar watter risikovlakke is aanvaarbaar? Waarna ons moet streef, is 'n stelsel wat duidelike keuse en aktiewe toestemming bied. Dit kan slegs bereik word as ons as 'n kollektiewe en verbonde samelewing bespreking en debat oopmaak.

'n Mensgedrewe gesprek

As die wetenskap werklik die mensdom op die beste moontlike manier gaan dien, moet ons duidelik wees oor die voorwaardes van interaksie en transaksie met mense. Om die samelewing in die kern van daardie gesprek te plaas, verseker dat hul eise, begeertes en bekommernisse gehoor word, en gee mense die geleentheid om beleid in te lig soos dit ontwikkel word.

'N Omvattende konsultasieproses waarby gewone mense uit alle vlakke van die samelewing betrokke is, sal nie net tot beter regulering lei nie, maar uiteindelik tot groter vordering in wetenskap en navorsing, met groot voordele vir die mensdom.

Op die oomblik bestaan ​​onduidelikhede rondom die deursigtigheid van sommige ondernemings en regulerende liggame wat verbintenisse en versekering oor die gebruik van data uitstuur. Dit lei tot 'n gebrek aan vertroue en keer dat mense gewillig na vore kom om hul DNA - hul genoom - te deel om mediese navorsing te bevorder en gesondheidsorg te bevorder.

Hoe gaan ons vorentoe?

Vir 'n globale gesprek om effektief te wees, moet dit gelei word deur die kundiges, wat volle deursigtigheid moet verskaf om die kwessies vir debat uit te lig. Tans is daar geen wêreldwye tweerigtinggesprek wat data skenkers sowel as die belangrikste begunstigdes van die data (die wetenskaplikes, maatskappye, dokters en pasiënte) raadpleeg nie.

Die kundiges moet 'eerste gaan' om hierdie dialoog te skep - dit beteken dat mediese, kliniese en akademiese instellings en beleidmakers die aannames agter hul 'mense se beste belange'-stellings duidelik verwoord en dan daardie aannames vir bespreking beskikbaar stel.

Op sy beurt moet die samelewing die risiko's wat inherent is aan die deel van hul data met individue en organisasies kan opweeg en balanseer voordat daar besluit word of hulle dit moet aanvaar of nie.

Die klem van denke moet geplaas word op hoe wetenskap en menslikheid saam vorentoe beweeg en saamwerk. As 'n samelewing is ons gesamentlik 'n vennootskap en ons het lede van die samelewing nodig om dieselfde visies met wetenskaplikes te deel, sodat die reis na menslike ontdekking een is wat saam gemaak word.

Dit is tyd vir 'n inklusiewe gesprek. Die tyd vir daardie gesprek is nou.


Abstrak

Sedert die voltooiing van die Human Genome -projek aan die begin van die eeu, was daar 'n ongekende vermeerdering van genomiese sekwensdata. 'N Gevolg hiervan is dat die mediese ontdekkings van die toekoms grootliks afhang van ons vermoë om groot genomiese datastelle te verwerk en te ontleed, wat aanhou toeneem namate die koste van volgordebepaling afneem. Hierin gee ons 'n oorsig van wolkrekenaars en big data -tegnologieë en bespreek ons ​​hoe sulke kundigheid gebruik kan word om die groot datastelle van biologie te hanteer. In die besonder sal groot datategnologieë soos die Apache Hadoop -projek, wat verspreide en parallelle dataverwerking en ontleding van petabyte (PB) skaaldatastelle bied, bespreek word, tesame met 'n oorsig van die huidige gebruik van Hadoop binne die bioinformatiese gemeenskap.


RESULTATE

SNV's en indels in Korea1K-datastel

Heel-genoom volgordebepaling (WGS) data van 1007 bloed- of speekselmonsters (984 monsters met kliniese en biochemiese inligting) is gegenereer met 'n gemiddelde volgordebepalingsdiepte van 31× en saamgevoeg met volgordebepalingdata van 'n bykomende 87 bloed- of speekselmonsters (sonder kliniese inligting) ) uit die KoVariome -databasis (9). In totaal is 1094 volledige genome, insluitend 916 onverwante en gesonde individue, meestal van die Ulsan-metropolitaanse streek, vergelyk met die menslike genoomverwysing (hg38). 'n Totaal van 39,2 M SNV'e en 7,6 M indels is uit die datastel (tabel S1) opgeroep. Ons het vals-positiewe variante uitgefiltreer weens die volgordebatch-effek (fig. S1 en S2) en verwante individue, wat 'n stel variante bevat wat 34 M SNV's en 4.8 M indels bevat. Ons het die variante in vyf kategorieë verdeel op grond van hul allelfrekwensie in die Koreaanse bevolking (singleton: allele telling = 1 doubleton: allele telling = 2 skaars: allele telling van & gt2 en allelfrekwensie van ≤0.01 algemeen: allel frekwensie van & gt0.01 maar ≤0.05 en baie algemeen: alleelfrekwensie van >0.05 Fig. 1A). Om die krag van ons groot datastel uit te lig, is ongeveer die helfte van die variante wat ons geïdentifiseer het geklassifiseer as enkelton of dubbelton (alleeltelling van ≤2), en onverwags word meer as 70% van hulle nie in dbSNP (v150) gerapporteer nie (20). Aan die ander kant is minder as 20% van die variante as baie algemeen geklassifiseer (alleelfrekwensie van >0.05), met meer as 94% van hierdie variante wat voorheen in dbSNP (v150) gerapporteer is (20). 'N Totaal van 96,6% van die baie algemene SNV's oorvleuel met KoVariome (9), vergeleke met slegs 12,4% van die seldsame SNV's (fig. S3). Die aantal variante met 'n allelfrekwensie van & gt0.01 was soortgelyk aan ander nie-Afrikaanse bevolkings (1KGP nie-Afrikaans en 3.5KJPN), terwyl daar 'n veel hoër aantal variante was, wat 'n allelfrekwensie van ≤0.01 het KoVariome as gevolg van Korea1K se veel groter steekproefgrootte (fig. S4). Op grond van die finale stel variante het elke individu gemiddeld getoon

4,42 M variante (3,58 M baie algemeen, 0,4 M algemeen, 0,31 M skaars, 0,46 M doubleton en 0,85 M singleton variante), waarvan 8928 en 918 onderskeidelik nie -sinoniem en funksieverlies (LoF) was.

(A) Aantal variante in die Korea1K-datastel in alle outosomale streke gekategoriseer op grond van alleelfrekwensies (AF's). Enkelton, alleeltelling = 1 dubbelton, alleeltelling = 2 seldsaam, alleeltelling van >2 en alleelfrekwensie van ≤0.01 algemeen, alleelfrekwensie van >0.01 en alleelfrekwensie van ≤0.05 en baie algemeen, alleelfrekwensie van >0.05. (B) Die aantal nuwe variante as 'n funksie van onverwante Koreaanse genoommonsters.

Vervolgens het ons elke variant geklassifiseer in 1 van 19 verskillende variantklasse (dws intergenies en intronies) gebaseer op die funksionele impak en ligging in die genoom (fig. S5). LoF -variante (nonsens, non -stop, splicing site en indel variante) in die Korea1K -stel het 'n hoër verhouding van seldsame, doubleton- of singleton -variante as ander streekklasse, wat die effek van suiwerende seleksie op hierdie variante aandui. Boonop is die allel (plek) frekwensiespektrum van onverwante individue gebruik om die breuk onder seleksiedruk in verskillende genomiese streke te skat (21). Ons het bevestig dat LoF -variante die grootste deel van die plekke onder negatiewe seleksie het (fig. S6). Ons het dieselfde vergelykende analise op die hele genestel toegepas en gevind dat 16 gene hoë suiwerende seleksiedruk getoon het, wat selfs sterker was as die seleksie vir nie-sinonieme variante oor die genoom. Vier gene toon negatiewe waardes wat dui op positiewe seleksiedruk (fig. S7). Wat indels betref, het die Korea1K -stel meer uitvee (2,573,411) as invoegings (2,155,644) vertoon, moontlik as gevolg van skewe variantoproepe (fig. S8). Indels in proteïenkoderingstreke vertoon hoër pieke onder die raamindels, gebaseer op hul lengte, wat dui op suiweringskeuse (fig. S9) (22).

Die ontdekkingsyfer van nuut waargenome variante van onverwante individuele genome is 'n metode om genomiese diversiteit in 'n gegewe populasie te kwantifiseer (23). Die patroon van nuut waargenome, nie -gedeelde variante van onverwante Koreaanse genome is ondersoek met behulp van die vyf allelfrekwensie -kategorieë (Fig. 1B). Die ontdekkingskoers van baie algemene (alleelfrekwensie van >0.05) variante versadig na 132 monsters (14.4%), terwyl die tempo van enkelton- en dubbeltonvariante steeds toegeneem het nadat al 916 gesonde onverwante monsters ontleed is. Toe ons die aantal nuut waargeneem variante in onverwante individue vergelyk met die voorheen gepubliseerde KoVariome, het Korea1K onverwags 'n effens hoër tempo van nuwe variantontdekking getoon as KoVariome (fig. S10 Korea1K, 101,866 KoVariome, 48,051 vir 50ste individu). Hierdie toename is moontlik veroorsaak deur die implementering van nuwer weergawes van die pyplyn met variante en die verwysing na die menslike genoom. Soos verwag, bevestig dit ook dat meer opeenvolgende genome nodig is om baie skaars variante in die Koreaanse bevolking te dek.

Die Korea1K-stel het 266 081 nie-sinonieme SNV's bevat. Onder hulle is 118,417 en 117,414 geklassifiseer as proteïenbeskadigend deur PolyPhen (24) (moontlik beskadig, 46,116 waarskynlik beskadig, 72,301) en SIFT (25) (onderskeidelik skadelik, 117,414). In totaal is 87,671 variante voorspel as proteïenskade deur beide programme, en hul allelfrekwensie is skeef na seldsame frekwensies, terwyl goedaardige of verdraaide variante skeef is na algemene frekwensies, wat weer dui op suiwerende seleksie (fig. S11).

Toe mitochondriale en chromosomale Y -haplogroepe onder die Koreaanse individue (fig. S12 en S13) ondersoek is, was die algemene tipes D (34,19%), B (13,89%) en M (13,80%) mitochondriale en O (73,49%) , C (16,9%) en N (6,58%) chromosomaal Y (26, 27). Die O manlike haplogroep is wyd versprei in Oos -Asië en Suidoos -Asië, terwyl die C -haplogroep prominent versprei word in Oos -Asië en Noordoos -Asië (26). Ons het ook ander redelik algemene mitochondriale haplogroepgroepe (A, G en F) in Oos -Asië geïdentifiseer (28).

Genomiese kenmerke van Koreane in vergelyking met ander bevolkings

Ons het die genetiese eiesoortigheid van ons Korea1K-monster beoordeel deur gebruik te maak van hoofkomponent-analise (PCA) met die klein grootte variante (SNP en indel) in ons datastel en 1KGP. Soos voorheen gerapporteer, het die hoofkomponente PC1 en PC2 met wêreldwye bevolkings 'n aparte Oos -Asiatiese groep getoon (Fig. 2A). Alhoewel Koreane, Chinees en Japannese geneties baie naby aan alle ander individue is (29), het ons gevind dat die drie bevolkings onderskeidelik van mekaar gegroepeer het (Fig. 2B). Hierdie patroon is herhaal deur ADMIXTURE analise met K = 3 (fig. S14).

Resultate van PCA van Korea1K en die 1KGP stel (A) wêreldwye bevolkings en (B) Oos-Asiatiese monsters. (C) Die aantal TE-invoegings met aansienlik verskillende alleelfrekwensies tussen die Korea1K-stel en die populasie. (D) Die verhouding van differensiële TE -invoegings. Kleure dui TE -subtipes aan. Afkorting vir bevolkings is dieselfde bevolkingskode as 1KGP (ACB, African Caribbean ASW, African Ancestry in Southwest USA BEB, Bengali CDX, Dai Chinese CEU, Utah-inwoners met Noord- en Wes-Europese afkoms CHB, Han Chinese CHS, Southern Han Chinese CLM, Colombiaans ESN, Esan FIN, Finse GBR, British GIH, Gujarati GWD, Gambian Mandinka IBS, Iberian ITU, Telugu JPT, Japanese KHV, Kinh Vietnamese LWK, Luhya MSL, Mende MXL, Mexican Ancestry PEL, Peruaanse PJL, Punjabi PUR, Puerto Rican STU , Tamil TSI, Toscani en YRI, Yoruba).

Om funksioneel relevante variante te ondersoek, het ons 1048 ClinVar patogene variante wat in Korea1K gevind is, onttrek. Onder hulle het 242 variante 'n alleelfrekwensie groter as 0,1 in Korea1K gehad, wat hoog is vir patogene variante (fig. S15). Ons het ook 35 dwelm-reaksie-variante gevind wat in ClinVar (fig. S16) geannoteer is, en 11 van hulle het beduidend verskillende alleelfrekwensies vertoon as dié van die Chinese of Japannese individue in die 1KGP-stel, wat die belangrikheid van populasiespesifieke datastelle beklemtoon wanneer patogenies geïnterpreteer word. of dwelm-reaksie variante. Byvoorbeeld, die variant rs4961 in ADD1 het die hoogste frekwensie in die Korea1K gehad in vergelyking met ander bevolkings en word geassosieer met hipertensie en reaksie op furosemied en spironolaktoon, soos getoon in 'n Europese studie (30, 31). Daar is egter geen beduidende verband met bloeddruk gevind in ons GWAS met behulp van die Korea1K-stel nie (sien die afdeling "Genoomwye assosiasie-studie" vir meer inligting).

Ons het CNV's, TE-invoegings en HLA-1-haplotipes geïdentifiseer (sien Aanvullende materiale en metodes) aangesien WGS-data talle variante kan identifiseer uit komplekse of hoogs veranderlike nongeniese streke (16, 17). Korea1K bevat 1441 CNV -loci, en 80% van hulle oorvleuel met die CNV -stel uit die hele 1KGP -monsters, terwyl dit nie oorvleuel met segmentale dupliseringsstreke nie. Vier algemene CNV's (steekproeffrekwensie van & gt0.05) oorvleuel met dié in die 1KGP-stel en is gevalideer deur 'n sekondêre CNV-oproeper (aanvullende materiaal), wat op hul beurt vyf proteïenkoderingse bevat (fig. S17 en S18, uitgebrei) datatabel S1). Onder die vier algemene CNV's het Korea1K 'n kopie duplisering van gehad CLPS, 'n pankreaskolipase, wat betrokke is by dieethidrolise van die dieet.

Vir TE -polimorfismes is die patrone van TE -invoegings tussen die Koreaanse en ander bevolkings ondersoek deur PCA (fig. S19 en S20 en tabel S2). PC1 en PC2 het geïdentifiseer dat vier superbevolkings (Afrikane, Asiërs, Amerikaners en Europeërs) goed van mekaar geskei was, terwyl subbevolkings in Oos-Asië dit nie was nie. Daarom is 'n spesifieke TE-invoegingspatroon alleen onvoldoende om subpopulasies in Oos-Asië fyn te onderskei, hoewel die genomiese diversiteit duidelik in die alleelfrekwensieverspreiding weerspieël is (fig. S21 en S22). TE-invoegings met aansienlik verskillende alleelfrekwensies tussen Koreane en 26 ander populasies in die 1KGP-stel is opgesom, en soos verwag, het Korea1K aansienlik minder differensiële TE-invoegings vertoon in vergelyking met Oos-Asiatiese bevolkings as nie-Oos-Asiërs (Fig. 2, C en D en uitgebreide datatabel S2). Verder het ALU en SINE-VNTR-ALU's (SVA) 'n groter proporsie differensiële TE-invoegings vertoon as Long interspersed nuclear element (LINE) in JPT, CHB en CHS, waarskynlik as gevolg van verskillende invoegtempo's op die TE-tipes.

Ons het ook HLA-tipes in Korea1K vergelyk met dié in publieke beskikbare databasisse wat Europese, Amerikaanse en Asiatiese HLA-frekwensies bevat (fig. S23 en S24). Ons HLA alleel frekwensie patroon was baie soortgelyk aan die HLA haplotipe verspreiding van Koreaanse monsters van die publieke databasis. HLA tipes A*24:02, A*26:01, A*31:01, B*40:02 en B*52:01 het aansienlik laer alleelfrekwensies in die Koreaanse bevolking vertoon relatief tot die Japannese bevolking (Fisher se presiese toets P = 3,61 × 10 −49, 7,09 × 10 −8, 1,34 × 10 −12, 9,61 × 10 −12, en 3,13 × 10 −42, onderskeidelik), terwyl tipes A*33: 03 en B*44: 03 hoër was alleelfrekwensies (Fisher se presiese toets P = 3.10 × 10 −46 en 1.00 × 10 −5, onderskeidelik). Alhoewel die Japannese geneties baie na aan die Koreaanse is, verskil die HLA-tipe profiele van hierdie bevolkings aansienlik. Ons het egter ooreenkomste in die Asiatiese bevolkings geïdentifiseer, byvoorbeeld tipes A*33:03, A*02:06 en B*58:01 het relatief hoë alleelfrekwensies vertoon, terwyl tipes A*02:01, A*03:01 , A*01:01, A*32:01, A*68:01, B*07:02, B*44:02 en B*08:01 het lae frekwensies in Asiatiese bevolkings (Koreaans, Japannees en Sjinees) vertoon populasies) in vergelyking met ander groepe.

GWAS gebaseer op kliniese eienskappe

Danksy sy uitgebreide genomiese dekking, is bevolkingskaal WGS-data meer effektief as skyfiegebaseerde benaderings om statisties beduidende assosiasies met kwantitatiewe eienskappe en siektes te identifiseer (12). Dit is selfs kragtiger as ooreenstemmende kliniese of fenotipiese data beskikbaar is vir die genome (32). In die Korea1K -stel kon ons 79 kwantitatiewe kliniese eienskappe kwantifiseer, gemeet aan 984 monsters (uitgebreide datatabel S3) deur middel van gesondheidsondersoeke wat aan die KGP -deelnemers verskaf is. Ons het assosiasies ontleed deur bykomende genetiese modelle met relevante kovariate te pas vir 79 kwantitatiewe eienskappe en 6 658 227 variante [5 932 215 SNV's en 726 012 indels minor allel frekwensie (MAF) van & gt1%] van 823 onverwante individue van die 984 monsters. Die analise het gelei tot 467 variante wat via GWAS statisties gekoppel was aan 11 kwantitatiewe eienskappe (P < 7,5 × 10 −9 , die Bonferroni-gekorrigeerde betekenisdrempel). Die 467 variante is in 15 onafhanklike lokusse op agt chromosome saamgevoeg, en 11 van hulle bevat voorheen gerapporteerde variante wat aan 'n eienskap gekoppel is. Ons het gevind dat 11 indeksvariante nie teenwoordig was op die algemeen gebruikte Illumina Omni 2.5 menslike SNP-skyfie nie (Fig. 3, Tabel 1, fig. S25 tot S28, en uitgebreide datatabelle S4 en S5). Onder die 11 lokusse van gerapporteerde variante het 9 variante bevat wat in die GWAS-katalogus (33), maar hul indeksvariante is nuut geïdentifiseer in hierdie studie. Van die 15 onafhanklike lokusse kon ons 1 voorheen onbekende lokus in identifiseer MAMASTR, wat geassosieer word met kankermerker (koolhidraatantigeen 19-9 en karsinoembryoniese antigeen). ’n Voorheen ongeïdentifiseerde lokus is ook in gevind WDPCP, wat verband hou met liggaamsvet persentasie. Nog 'n voorheen onbekende lokus in SERPINA7 gevind, wat verband hou met triiodothyronine. Ons het ook twee lokusse op chromosoom 2 gevind (rsID: rs28946889, eienskap: totale bilirubien, P = 1,85 × 10 −23 rs662799, neutrale vet, P = 4,22 × 10 −10) wat voorheen geïdentifiseer is in twee Koreaanse GWAS (34, 35). Die MAF's in die voorheen ongeïdentifiseerde lokusse was aansienlik laer as dié wat voorheen gerapporteer is toe ons die MAF's van GWAS -variante in hierdie voorheen gerapporteerde en die ongerapporteerde lokusse vergelyk het (figuur S29). Dit beteken dat grootskaalse variome van WGS-data help om lae-frekwensie-allele en ongerapporteerde lokusse te identifiseer via heelgenoom-gebaseerde GWA-studies.

Elke kleur dui op 'n ander kliniese eienskap. Die mees betekenisvolle gerapporteerde merkers in die lokusse word met driehoeke aangedui. Die stippellyn dui die drempel vir genoomwye betekenis aan (7,5 × 10 −9). Die stippellyn dui die drempel aan vir studie-wye betekenis (9,5 × 10 −11).

Gemerkte rye dui ongerapporteerde variante met hoër betekeniswaardes aan, geleë in dieselfde koppelingsongelykheidsblok met gerapporteerde variante.


INSAMELING EN INHOUD VAN INLIGTING

Wiki -formaat

SNPedia is 'n Semantiese MediaWiki-werf ( 1) wat geredigeer en bygewerk word deur beide outomatiese en handmatige wyses.Dit is bedoel om geformateer te word op 'n manier wat outomatiese verslagontleding en generering deur geassosieerde sagteware ondersteun (soos Promethease, hieronder bespreek), terwyl dit steeds 'n vlak van leesbaarheid vir beide toevallige en gereelde gebruikers behou.

R -nommers

Die NCBI dbSNP-databasis (2) katalogiseer meer as 10 miljoen nie-oortollige verwysings-SNP's. Elkeen kry 'n identifiseerder wat begin met die tweeletterkode rs en dan 'n unieke nommer. Hierdie identifiseerder word wyd gebruik, soos op grootskaalse mikroskikkings, en is nou algemeen in wetenskaplike literatuur. Dit is ook toeganklik vir nie-wetenskaplikes via genotiperingsdienste van Direct To Consumer (DTC). Die rs# identifiseerder verskaf 'n presies gedefinieerde ligging in die genoom en word maklik uit die wetenskaplike literatuur ontleed. Dit is stabiel oor genoombou, so dit vereis nie dat navorsers van tyd tot tyd ou koördinate op nuwer geboue moet hermap nie. Hoewel dit meestal 'n enkele nukleotiedpolimorfisme (SNP) verteenwoordig, is dbSNP nie beperk tot enkele nukleotiedvariante nie, en 'n rs# kan dus ook indelle van wisselende grootte verteenwoordig. Byvoorbeeld, rs333 is 'n indel van 32 nt. Daarteenoor dek dbVAR (2) groter variante. Wat die dekking van spesies betref, terwyl dbSNP spesies agnosties is, fokus SNPedia tans op menslike data, maar bevat 'n paar nie-menslike rs#s om toekomstige ondersteuning te verseker.

Soorte inhoud

Die basiese eenhede van inligting in SNPedia is enkel- of meervoudige nukleotiedposisies in die menslike genoom waarvan bekend is dat dit verskil in óf kiemlyn- óf somatiese kontekste. SNPedia versamel tans inligting oor enkele nukleotiedvariante soos SNP's en mutasies, of meer spesifiek, oor genotipes wat uit een of meer variantloki bestaan. 'n Bladsy met inhoud word geskep op grond van 'n enkele rs-identifiseerder (soos onderhou in dbSNP), en dan word tipies drie geassosieerde bladsye geskep, wat die drie moontlike genotipes vir daardie SNP weerspieël (homosigoot vir die hoofalleel, heterosigoties en homosigoties vir die minderjarige alleel op daardie lokus). Sover moontlik word 'n opsomming van die kansverhoudings vir een of meer gepaardgaande mediese toestande vir elke genotipe gerapporteer. Stel genotipes van ongekoppelde lokusse, bekend as genosette, word ook in SNPedia gedefinieer. Bykomende inhoudstipes sluit in die gene, fenotipes, mediese toestande en geneesmiddelinteraksies wat met hierdie variante geassosieer word.

Gebruikers dra beide gestruktureerde data en vryteksopmerkings by met 'n kombinasie van standaard Mediawiki -sintaksis en Semantiese vorms. Voorbeeldeienskappe sluit in 'Magnitude', wat 'n kwalitatiewe opsomming van betekenis op 'n skaal van 0.0-10 gee, en 'Repute' vir gevolge wat as duidelik 'goed' of 'sleg' geklassifiseer kan word. Onbeperkte wiki -teks met hiperskakels, beelde en opmaak bied die moontlikheid om subtiliteit te kommunikeer sonder om meer gestruktureerde dataformate te hê.

Bronne van inhoud

Data word versamel uit beide grootmaat en individuele bronne. As 'n wiki, voeg gebruikers data op 'n deurlopende basis by, en hierdie byvoegings word aangevul deur periodieke opdaterings wat van publieke databronne ontgin word. Inhoudsbronne verwys na publikasies, veral PMID- of DOI -identifiseerders van Pubmed. SNPedia is daartoe verbind om persoonlike toegang tot alle inligting wat bygedra is, te handhaaf.

Kriteria vir insluiting

Terwyl SNPedia 'n breë net werp met betrekking tot die skepping van 'rs-bladsye' wat individuele SNP's definieer, word genotipe-spesifieke bladsye hoofsaaklik slegs geskep vir variante wat beduidende mediese of genealogiese gevolge het gebaseer op gepubliseerde meta-analises, studies van ten minste 500 pasiënte of twee of meer onafhanklike studies (dws herhaalde bevindings), of ander historiese, statistiese of mediese betekenis. Dit laat sagteware toe om persoonlike genoomverslae te skep, wat gebaseer is op die genotipes wat met 'n individu gedra word, om meer robuuste verslae te skep. Met enkele uitsonderings bevat SNPedia se genotipe-spesifieke bladsye oor die algemeen nie variante wat ongerepliseer is of van studies met minder statistiese krag nie. Variante met 'n hoë penetrasie, soos dié wat ook in OMIM (3) of in LSDB's gerapporteer kan word, word egter toenemend by SNPedia gevoeg. Dikwels is hierdie variante so selde dat dit nie in 'n populasie waargeneem is nie, waargeneem, en daarom is dit nie in dbSNP voorkom nie. In sulke gevalle stuur SNPedia hul genomiese data direk by dbSNP in om rs -nommers toegeken te kry. Na vrystelling in dbSNP word hierdie variante dan by SNPedia gevoeg. 'N Voorbeeld van so 'n variant is die del-F508-mutasie wat die mees algemene variant van sistiese fibrose (4) verteenwoordig, wat nou in dbSNP (en dus SNPedia) as rs113993960 voorgestel word. Enigeen wat belangstel om spesifieke variante op hierdie manier by dbSNP te laat gevoeg word, word aangemoedig om SNPedia te kontak.

Samestelling van data

Daar is ten minste vier vlakke van data -samestelling. Eerstens word alle toevoegings en veranderinge aan die SNPedia deur wiki -gebruikers (insluitend die redakteurs) hersien. Tweedens, Semantiese Mediawiki-sjablone vlag sekere waarskuwings (soos SNP's met geen toegewysde chromosoom, of bekend onder ouer/verval name) om dit prominent onder die lesers en redakteurs se aandag te bring. Ten derde, ten minste twee onafhanklik ontwikkelde sagteware bots kruip gereeld die hele webwerf van buite af. Hulle voeg aanvullende inligting by soos chromosoom, posisie, geen en alleliese data. Alhoewel dit ontwerp is om versigtig te wees en geen inligting deur 'n mens te vervang nie, is hierdie bots dikwels die eerste om onreëlmatighede op te spoor. In die vierde plek word SNPedia -inhoud gebruik in Promethease persoonlike genoomverslae gelees deur 'n uiteenlopende gehoor wat problematiese bewerings kan herken. Hulle is uniek en gemotiveerd om foute of nuanses wat in die oorspronklike navorsing gemis is, op te spoor en aan te meld.

Inhoudsgroei

Die SNPedia-wiki is sedert 2006 aanlyn toeganklik en dateer voor die koms van die DTC genomiese toetsondernemings. Vanaf minder as 1000 SNP's, het dit nou ongeveer 25 000 SNP's (figuur 1), 10 000 genotipes en 200 genosette. SNP's word geassosieer met 200 of meer mediese toestande en 150 of meer medisyne. Belangriker nog, die groei in beide nuwe inskrywings per week sowel as in wysigings per bladsy gedurende die afgelope 5 jaar was bestendig en konsekwent. Bykomende statistieke wat opgespoor word, sluit in die aantal SNP's wat verband hou met elke siekte -kategorie (vir die 10 met die grootste aantal geassosieerde SNP's, is die reeks 114 tot 229 vir alle siektes, die gemiddelde is 27 SNP's/toestand) en die getal van gepubliseerde PMID's per SNP (wat tans wissel van 29 tot 60 vir die 10 SNP's met die grootste aantal verwante verwysings).

SNPedia Groei. Die totale aantal individuele SNP's wat die afgelope 4 jaar in SNPedia beskryf is. Let daarop dat die y-as is logaritmies.

SNPedia Groei. Die totale aantal individuele SNP's wat die afgelope 4 jaar in SNPedia beskryf is. Let daarop dat die y-as is logaritmies.

Erfgename

Baie interessante fenotipes is afhanklik van meer as 'n enkele variant. Soos hierbo genoem, het SNPedia, om dit akkuraat te modelleer, 'n notasie vir sulke stelle genomiese variante, bekend as 'genosets', bekendgestel en 'n ontleder in Promethease geïmplementeer. Byvoorbeeld, om die twee SNP's wat homosigositeit vir APOE4 definieer, te herken, word die genosetkriteria presies soos volg opgemerk: en die moontlikheid om ten minste een APOE4 -allel te hê, word voorgestel as:

Genosets kan na ander genosets verwys, en sikliese verwysings word opgelos. Die Boolese operateurs ('en', 'of' 'nie') sowel as 'ten minste (N, lys)' word ook deur Promethease ondersteun. Die huidige nomenklatuur maak dit moeilik om gekoppelde SNP's van dieselfde string te onderskei (dit wil sê in cis), wat, hoewel geskik vir data van mikroskikkings en van ongekoppelde lokusse, verbetering sal vereis gegewe die koms van volledige genoomvolgordebepaling en gefaseerde data.


Persoonlike genomiese gegewensmonsters - Biologie

Die IndiGen -program het ten doel om die volgorde van genome van duisende individue uit verskillende etniese groepe uit Indië te volg. Die doelwit is om genetiese epidemiologie moontlik te maak en toepassings vir openbare gesondheidstegnologie te ontwikkel deur gebruik te maak van bevolkingsgenoomdata.

Kom meer te wete oor Genomics en hoe Genomiese tegnologie lewens begin beïnvloed het

Daar is verskeie geleenthede om aan die program deel te neem. Lees meer oor die maniere waarop u kan deelneem en bydra

Uitdrukking van belangstelling uit die nywerheid om die kennisbasis van alleelfrekwensies van genetiese variante te lisensieer en om vennootskap op gebiede van genomika en toepassings in gesondheidsorg te ondersoek

Jain A, Bhoyar RC, Pandhare K, Mishra A, Sharma D, Imran M, Senthivel V, Divakar1 MK, Rophina M, Jolly B, Batra A, Sharma S, Siwach S, Jadhao AG, Palande NV, Jha GN, Ashrafi N , Mishra PK, Vidhya AK, Jain S, Dash D, Senthil Kumar N, Vanlallawma A, Sarma RJ, Chhakchhuak L, Kalyanaraman S, Mahadevan R, Kandasamy S, Pabitha BM, Rajagopal RE, Ramya E, Nirmala Devi P, Bajaj A , Gupta V, Mathew S, Goswami SG, Mangla M, Prakash S, Joshi K, Meyakumla, Sreedevi S, Gajjar D, Ronibala Soraisham, Yadav R, Silla Devi Y, Gupta A, Mukerji M, Ramalingam S, Binukumar BK, Scaria V, Sivasubbu S IndiGenomes: 'n omvattende hulpbron van genetiese variante van meer as 1000 Indiese genome Nukleïensure Navorsing (2020) doi: 10.1093/nar/gkaa923


Welstand verslae


(1) Salari K, Karczewski KJ, Hudgins L, Ormond KE (2013) Bewyse dat persoonlike genoomtoetsing studenteleer in 'n kursus oor genomika en persoonlike medisyne verbeter. PLoS EEN 8(7): e68853. doi: 10.1371/journal.pone.0068853

(2) Weber KS, Jensen JL, Johnson SM (2015) Afwagting op persoonlike genomika -data verhoog die belangstelling en leeromgewing in genomika en molekulêre biologie voorgraadse kursusse. PLoS EEN 10(8): e0133486. doi: 10.1371/joernaal. pone.0133486


Inleiding

Die dalende koste van volgordebepalingtegnologieë (Hayden 2014) ondersteun deur onlangse vooruitgang in bioinformatika het neergekom op 'n verbetering in genomiese dataproduksie. In die lig van die toenemende beskikbaarheid van genomiese data, is data -deel en oop toegangsbeleid bevorder deur groot internasionale konsortia om die gebruik van gegenereerde datastelle te maksimeer en die statistiese krag van studies te verbeter. Befondsingsorganisasies het ook beleide opgestel om die toeganklikheid en die gebruik van datastelle uit te brei deur van navorsers te vereis dat planne vir die deel van data in hul voorstelle om fondse te soek (Foster en Sharp 2007 NIH 2014). Gevolglik is sentrale aanlyn databasisse soos die databasis van genotipes en fenotipes (dbGaP) a en die Europese genoom-fenoomargief b aangewys om groot volumes data te huisves, hetsy op 'n publiek toeganklike of beheerde wyse.

Nie verrassend nie, het die unieke kenmerke van datadeling die bestuur van genomiese databasisse uitgedaag (Knoppers et al. 2007 Peppercorn et al. 2012). Die daaropvolgende gebruik van genomiese data wat oorspronklik vir 'n enkele projek versamel is, gee 'n nuwe draai aan die bespreking oor die toereikendheid van ingeligte toestemming en die behoefte om navorsingsdeelnemers in te lig oor moontlike risiko's, voordele, navorsingsdoelwitte en onttrekkingsopsies. Hierdie verwikkelinge het tot die gevolgtrekking gekom dat tradisionele eenmalige toestemming op papier in die tyd van datadeling tot sy uiterste beperk is (Hayden 2012). Daarbenewens blyk die versekering van privaatheid van deelnemers as 'n uitdaging. Alhoewel de-identifikasie van data tradisioneel gesien is as 'n reaksie op privaatheidskwessies, kan dit te kort skiet in die konteks van genomiese data (Kaye 2012), aangesien DNS 'n unieke identifiseerder is.

Alhoewel verantwoordelikhede van navorsers en biobanke in die bevordering van deelpraktyke omvattend uitgespreek word, word ook individue versoek om by te dra tot sulke inisiatiewe (Dolgin 2010 Hand 2010 Kaye 2012). Webgebaseerde inisiatief vir die deel van persoonlike genomiese data of “crowdsourcing” -inisiatiewe (Barry 2009) moedig die verskaffing van persoonlike genomiese data en gesondheidsverwante inligting deur individue aan vir navorsingsdoeleindes. Die betrokkenheid van individue by sulke inisiatiewe vir die deel van persoonlike data word vergemaklik deur die verhoogde toeganklikheid van persoonlike genomiese data, wat deur kommersiële toetsverskaffers aangebied word tesame met die beskikbaarheid van interaktiewe inligtingstegnologie. Beloftes om potensiaal van persoonlike genomiese data te benut, motiveer individue om deel te neem aan aktiwiteite wat gedeel word.

Verskeie inisiatiewe vir die deel van persoonlike genomiese data word verskillend georganiseer, volgens hul missies en doelwitte. In sommige gevalle word die deel van persoonlike genomiese data weergegee in die vorm van die plaas van persoonlike genomiese data of dié van familielede op publiek toeganklike persoonlike webblaaie. Byvoorbeeld, die idee van Corpasome verwys na 'n poging deur die Corpas-familie om die persoonlike genomiese data wat aan vyf lede van die familie behoort, in die openbaar te deel (Corpas 2013). In hierdie situasies word persoonlike genomiese data gewoonlik geplaas om toegang te verbreed en daaropvolgende analise en interpretasie deur verskillende belangstellende navorsers moontlik te maak.

By ander geleenthede kan intermediaire data -deelplatforms die deel van persoonlike genomiese data vergemaklik deur projekte te begin om genotipe data en mediese inligting aan te bied en te deel. Daardeur kan individue wat toegang tot hul genomiese data en mediese rekords het, hul data op die aangewese webblaaie oplaai. Maak die data vry c, Genomera d en Pasiënte Soos Ek e is voorbeelde van hierdie projekte. In die raamwerk van hierdie platforms is beleide vir die insameling en deel van data dikwels omskryf in die privaatheidsbeleidverklarings of toestemmingsvorms. Daarbenewens, in sommige projekte, soos Maak die data vryword deelnemers gevra om aan die opnames deel te neem en om verskillende vrae rakende hul gesondheidstatus of enige bestaande gesondheidstoestande in die familiegeskiedenis te beantwoord.

Ondanks die waargenome verskille, word die klem op die individue se beheer oor hul data en die moontlikheid om data te deel, as 'n sleuteltema in hierdie inisiatiewe beskou. Om individue in staat te stel om hul persoonlike data te beheer, is pasgemaakte deelopsies aan deelnemers verskaf. Hierdie strategie is ontwerp met die doel om te reageer op die ontoereikendheid van die gebruik van 'n eenvormige benadering tot toestemming en privaatheidsvoorkeure (Nuffield Council on Bioethics 2013). Daardeur word individue gevra om te bepaal wie toegang tot hul data moet hê en vir watter doeleindes (Kaye et al. 2013).

Daarbenewens is daar geargumenteer dat 'n deurlopende betrokkenheid van individue wat deur webgebaseerde nutsmiddels moontlik gemaak word, 'n uitdaging kan aanspreek om kontak met deelnemers te behou (Wee 2013). Aangesien individue kon kies om weer deur derdeparty-navorsers gekontak te word tydens die deel van persoonlike data, is die versameling van meer gedetailleerde intydse inligting op versoek van navorsers as 'n geloofwaardige praktyk gevorder (McEwen et al. 2013). Sulke 'dinamiese fenotipering' (Lunshof et al. 2010), ondersteun deur webgebaseerde deel van persoonlike genetiese data, word voorgestel as 'n moontlike antwoord op die behoefte om fenotipiese en ander gesondheidsverwante inligting te koppel en te versamel in longitudinale voornemende studies waarin genomiese data gegenereer.

Etiese en juridiese dilemmas waarmee navorsersgedrewe of biobankgedrewe genomiese datadeling te kampe het, is breedvoerig in die literatuur bespreek (Fullerton et al. 2010 Harris et al. 2012 Kaye et al. 2009 Knoppers et al. 2011). 'n Paar studies het ook besin oor houdings van verbruikers rakende die deel van persoonlike genomiese data (Lee et al. 2013) en beleide wat deur direkte-na-verbruiker genetiese toetsmaatskappye aangewend word rakende hul navorsingsaktiwiteite aangevuur deur verbruikersdata (Esposito en Goodman 2009 Harris et al. . 2013 Howard et al. 2010). Min is egter gepubliseer oor die etiese en wetlike uitdagings rondom groeiende webgebaseerde persoonlike genomiese datadeling (Bloss 2013 Angrist 2014 Mathews en Jamal 2014). Om hierdie leemte te oorbrug, ondersoek hierdie referaat die uitdagings rondom sulke inisiatiewe in die lig van drie voorbeelde van huidige webgebaseerde projekte vir die deel van persoonlike genomiese data, naamlik Toestemming tot navorsing (draagbare regs toestemming) f, Bevry die data c en Genomes Unzipped (GNZ) g (Tabel 1). Twee uiteindelike doelwitte sal ons studie lei. Eerstens beoog ons om die wetlike en etiese dilemmas wat verband hou met die deel van persoonlike genomiese data te ontleed en bestaande voorsorgmaatreëls te evalueer. Tweedens wil ons insig gee oor hoe hierdie uitdagings in die raamwerk van hierdie drie projekte aangepak is. Vir hierdie doel beklemtoon die eerste deel van hierdie artikel die belangrikste kenmerke van die drie projekte op grond van toestemmingsvorms, privaatheidsbeleidverklarings en relevante inligting wat tussen Oktober 2013 en Februarie 2014 op die webwerf van hierdie projekte gehaal is. In die tweede deel, 'n paar kommer wat voortspruit uit die deel van persoonlike genomiese data, veral heridentifiseringsrisiko's, wetlike voorsorgmaatreëls en bestuursmeganismes, implikasies vir familielede, beperkinge van individue se beheer oor hul genomiese data en moontlike reaksies van die drie projekte hierop bekommernisse, word bespreek.

Webgebaseerde projekte vir die deel van persoonlike genomiese data: drie voorbeelde

Om lig te werp op die hoofkenmerke van die drie webgebaseerde persoonlike genomiese projekte vir die deel van data, is die toestemmingsvorm, privaatheidsbeleidverklarings en ander relevante inligting wat van die webwerwe van hierdie projekte verkry is, geraadpleeg. Soos in die volgende aangedui, deel die praktyk van die deel van persoonlike genomiese data 'n paar ooreenkomste, soos om individue onder die beheer van hul data te plaas en die gebruik van die webgebaseerde voertuie om die deel van persoonlike data te vergemaklik, en beklemtoon die belangrikheid van sodanige bydrae tot die bespoediging van navorsing. Maar hulle verskil ook in verskeie aspekte, insluitend missies, skaal en privaatheidsmodelle.

Toestemming tot navorsing

Toestemming tot navorsing is 'n projek geïnisieer deur Sage Bionetworks h, 'n navorsingsorganisasie sonder winsbejag in Seattle, VSA, wat daarop gemik is om 'biomediese navorsing te herdefinieer deur middel van oop stelsels, aansporings en norme'. Om hierdie doelwitte te bereik, Sage Bionetworks het die Draagbare wettige toestemming (PLC) i-meganisme as deel van 'n bestuursprojek wat gebruiksvoorwaardes, privaatheidsbeleide en datagebruikooreenkomste sowel as ingeligte toestemming en wetlike bepalings insluit. Soos uitgebrei binne die PLC, poog die projek "om groot datastelle te skep van gebruikers-bygedra gesondheids- en genomiese data wat makliker is om te hergebruik, om samewerking en innovasie rondom gesondheid en genomiese navorsing te bevorder en om enige vrywilliger 'n aktiewe rol in die navorsingsproses te speel" . In die uitoefening van hierdie missie, Sage Bionetworks versamel genomiese, fenotipiese, waarnemings-, gesondheidsverwante en ander vorme van inligting van vrywillige individue om verskeie navorsingstudies te voer. Die eerste studie van hierdie projek naamlik Self-bydraende kohort vir algemene genetiese navorsing (SCC-CGR) is tans gesluit vir inskrywing en die publikasie van resultate en data (totale vlak) word in die nabye toekoms verwag f.

By deelname aan hierdie projek kan individue daartoe instem om regte vir navorsing te verleen, hul data aan “Gekwalifiseerde navorsers” te herversprei, te publiseer en te kommersialiseer. Volgens die PLC: "Data wat ingesamel word, sal vir navorsingsdoeleindes beskikbaar gestel word aan 'n wye verskeidenheid gebruikers wat ingestem het om gebonde te wees aan 'n kontrak en aan spesifieke bepalings en voorwaardes wat die gebruik van die data op 'n etiese manier insluit, om geen skade aan te doen nie, individue nie heridentifiseer of weer kontak nie, en om hul navorsingsresultate openlik beskikbaar te stel vir die algemene publiek ”i.

Boonop, in 'n aanlyn opvoedkundige video wat nie omseil kan word nie, leer potensiële deelnemers oor die belangrikheid van wye datadeling om op 'n eties-gesonde wyse gerealiseer te word j . In terme van openbaarmaking, PLC bied deelnemers 'n opsie om hul data op 'n gedeïdentifiseerde manier te deel, tensy anders verlang. Daarbenewens word 'n nie-omvattende lys van moontlike risiko's en ongerief daarin vervat PLC oor onbedoelde gebruik van gedeelde data deur derde partye wat gevolglik die deelnemers of hul familielede kan benadeel. Die onbedoelde gebruik van data is verder geïllustreer deur 'n paar voorbeelde, soos die gebruik van data op 'n diskriminerende wyse teenoor die onderdane of hul familielede in die indiensneming, versekering of finansiële dienste. Wat die voordele betref, is dit verwoord dat die bydrae van persoonlike data geen direkte voordeel vir die deelnemers sou oplewer nie, aangesien die samelewing en wetenskap in die algemeen die begunstigdes van sulke inisiatiewe is.

Maak die data vry

Maak die data vry c is 'n projek geïnisieer deur 'n konsortium van organisasies, bestuur deur Genetiese Alliansie wat 'n nie-winsgewende gesondheidsvoorspraakorganisasie is. Bevry die data is daarop gemik om die ontdekking van 'verband tussen mutasies en gesondheidsuitkomste' te vergemaklik deur in te voer BRCA1/2 verslae in die openbare databasis van ClinVar wat 'n gratis, publiek toeganklike argief van verslae en inligting oor geenvariante is. Individue wat 'n verslag ontvang wat 'n mutasie in BRCA1 of BRCA2 gen word uitgenooi deur Bevry die data om 'n verskeidenheid persoonlike gesondheidsinligting te verskaf en hul mediese verslae in 'n publieke databasis te deel, ten einde "'n beter begrip van siekte, hoër kwaliteit pasiëntsorg en verbeterde menslike gesondheid" te verwesenlik. Behalwe persoonlike mediese verslae, word aan pasiënte ook die opsies gebied om verslae van hul wettige minderjariges of ander familielede op die webwerf op te laai. webwerf. Daarbenewens, in die raamwerk van die Projek vir kliniese verslae deel (SCRP) wat die kliniekarm van die Bevry die data projek, kan dokters hul pasiënte BRCA1/2 verslae op 'n on-geïdentifiseerde wyse m.

Individue word in staat gestel om hul deelvoorkeure teenoor 'n verskeidenheid potensiële datagebruikers aan te dui, gegroepeer as "Advocacy and Support Groups" en "Medical Researchers", en is in staat om hul keuses te eniger tyd te wysig (Nguyen en Terry 2013). Volgens die 'About Us' webwerf van die projek, 'Free the Data' gebruik 'n deelnemersgerigte platform waarmee u kan besluit hoeveel u deel en met wie. Deur gebruik te maak van privaatheids- en sekuriteitstegnologie soortgelyk aan bankwese, het u beheer oor u gesondheidsinligting en kan u u eie voorkeure vir deel, privaatheid en toegang tot data stel "n.

Genome onttrek

Genome Unzipped (GNZ) is 'n projek wat begin is deur 'n groep aktiewe navorsers op verskillende gebiede van genetika, sowel as spesialiste in die regs- en openbare gesondheidskwessies rondom nuwe genomiese tegnologieë. In hierdie projek het lede van GNZ publiseer hul eie genomiese data in die openbaar in die oortuiging dat 'goeie wetenskap beteken om volledige data vry te stel sodat ander dit kan ondersoek' g. Die opstel van “gereedskap vir die ontleding van rou genetiese data” saam met “die verskaffing van onafhanklike, onbevooroordeelde assesserings van die tegniese geldigheid en kliniese nut van 'n verskeidenheid genetiese toetsprodukte” is ingesluit in die waargenome uitkomste van die projek binne die Deelnemer Inligtingsvorm.

Boonop deur groot nie-anonieme navorsingsdatabasisse met oop toegang, soos die Persoonlike genoomprojek o, GNZ moedig individue aan om deel te neem aan 'n oop navorsingsprojek tot voordeel van die publieke belang. Alhoewel, op hierdie oomblik deelname van GNZ beperk is tot 15-20 kernlede wat kundigheid het op 'n gebied wat verband hou met die ontleding van genetiese data en hul familielede, is dit in die vooruitsig gestel dat individue uit die breër gemeenskap wat toegang tot hul genetiese data het, genooi word om hul data te deel in die toekoms. Volgens die webblad van GNZ projek, hoop die lede van die projek dat die bekendmaking van hul data in die openbaar "sal help om nuttige besprekings oor genetiese privaatheid en die voordele, risiko's en beperkings van genetiese inligting in die algemeen te lei", aangesien hulle "glo dat baie van die vrese uitgespreek is oor die gevare van genetiese inligting is oordrewe, en sien hierdie projek as 'n geleentheid om 'n konstruktiewe openbare gesprek te voer oor die waarheid agter hierdie vrese” g . GNZIn ooreenstemming met die uiteindelike doel van die projek om die persepsie van genetiese privaatheid te hervorm, volg dit 'n baie ander benadering as die twee ander projekte deur deelnemers in te lig dat geen privaatheid, anonimiteit of vertroulikheid gewaarborg word nie. Soortgelyk aan PLC, 'n lys van potensiële risiko's en ongemak wat met die deel van persoonlike genomiese data geassosieer word, is uiteengesit in die Deelnemersinligtingsvorm van GNZ projek wat in die proses van besluitneming deur deelnemers in ag geneem moet word.

Kommer wat verband hou met webgebaseerde projekte vir die deel van persoonlike genomiese data

Aktiwiteite van webgebaseerde inisiatiewe vir die deel van genomiese data kan 'n aantal etiese en wetlike uitdagings meebring. Die volgende gedeelte behandel die belangrikste bekommernisse wat met sulke inisiatiewe verband hou en evalueer die huidige reaksies van die bestudeerde projekte op die bekommernisse.

Identifiseerbaarheid en Heridentifikasie

Die moontlike toeganklikheid van verbindbare data verhoog die kommer oor die heridentifisering van gedeelde persoonlike genomiese data. Dit is onlangs getoon in 'n studie (Gymrek et al. 2013) waarin navorsers suksesvol vanne van vyf gedeïdentifiseerde deelnemers van die 1000 Genomes -projek p deur kort tandemherhalings op die Y -chromosoom te profileer en navraag te doen oor rekreatiewe genetiese genealogiese databasisse. Die integrasie van genomiese data met gesondheidsinligting en elektroniese mediese rekords is nog 'n element wat die moontlikheid van heridentifisering van die onderdane vergroot (Esposito en Goodman 2009).

In ooreenstemming met die privaatheidskwessies en die gedemonstreerde risiko's van heridentifisering, probeer die bestudeerde projekte deelnemers inlig oor privaatheidsrisiko's wat verband hou met breë persoonlike genomiese data-deel. Volgens PLC, alhoewel deelnemers kon inteken vir 'n gede-geïdentifiseerde datadeling, moet die risiko van heridentifikasie en verlies aan privaatheid as gevolg van foutiewe of kwaadwillige identiteitsopenbaarmaking oorweeg word. Maak die data vry projek waarsku ook deelnemers in die verklaring van die privaatheidsbeleid oor die onmoontlikheid om absolute privaatheid te waarborg omdat "nuwe kwesbaarhede en bedreigings elke dag verskyn". Die projek belowe deelnemers om die risiko's tot 'n aanvaarbare vlak te minimaliseer, aangesien dit nie moontlik is om die risiko's van databeskerming deeglik uit te skakel nie. Aan die ander kant, die GNZ Die projek bevoordeel die nie-anonieme benadering tot die uitruil van persoonlike data, en verklaar dat sommige van ons, gegewe die gemak waarmee 'n toegewyde snoop genetiese inligting verberg kan kry (byvoorbeeld deur vel, hare of speeksel), die hele idee van genetiese inligting privaatheid is in elk geval 'n illusie - alhoewel die vrylating van ons data aanlyn dit makliker maak vir mense om dit in die hande te kry, is dit 'n graadverskil eerder as 'n soort.

Die implikasies van die bekendmaking van heridentifiseringsrisiko's deur projekte vir die deel van persoonlike data kan egter bespreek word. 'N Mens kan redeneer dat deelnemers implisiet afstand doen van hul privaatheid en vertroulikheidsregte oor die gedeelde data deur die ondertekening van 'n openlike toestemming (Lunshof et al. 2008), wat onder meer die moontlike risiko's van heridentifisering insluit. Volgens die oop-toestemmingsmodel is de-identifiseerbaarheid van genomiese data 'n vergesogte belofte, daarom moet deelnemers bereid wees om die risiko's wat gepaard gaan met die deel van genomiese data te aanvaar (Lunshof et al. 2008).

Selfs as die ondertekening van so 'n toestemmingsvorm potensiële regsverantwoordelikhede van die skouer van data-deelplatforms teenoor deelnemers verwyder, moet dit nie as 'n etiese goedkeuring vir heridentifiseringspogings beskou word nie. In die nadraai van die onlangse heridentifiseringsdemonstrasies (Gymrek et al. 2013 Homer et al. 2008), is die kommer onder meer uitgespreek deur onder meer die werklike deelnemers aan projekte vir die deel van persoonlike genomiese data wat daarop wys dat die nie-konsensuele her- identifikasiepogings is eties laakbaar (Meyer 2013). Daar word aangevoer dat die toestemming van individue om deel te neem ten spyte van die moontlike risiko's van heridentifisering nie opgevat moet word as toestemming tot heridentifisering op sigself nie. "Selfs al bevat die toestemmingsvorm wat ten tyde van die oorspronklike versameling onderteken is, 'n vrywaring dat absolute anonimiteit nie gewaarborg kan word nie, maar heridentifisering van die DNS-monster verteenwoordig later 'n nuwe versameling wat sonder toestemming onderneem is" (Wilson 2013). Om individue te heridentifiseer, moet gedeelde genotipes (en gepaardgaande data soos geslag, ouderdom of siekte wat bestudeer word) in wese ooreenstem met beskikbare verwysingsgenotipes wat persoonlike datastelle met identifiseerders bevat. Alternatiewelik moet hulle skakel met nie-genetiese databasisse soos data in gesondheidsorg-, administratiewe, kriminele of rampreaksiedatabasisse (Lowrance en Collins 2007). As u een van hierdie roetes volg, sal dit lei tot die assosiasie van geïdentifiseerde persoonlike data met 'n verskeidenheid identifiseerbare inligting, terwyl die toestemming van die betrokke persone ontbreek.

Om die regte van navorsingsdeelnemers te eerbiedig, moet data-delingsprojekte wat betrokke is by ont-geïdentifiseerde aktiwiteite vir die deel van persoonlike data, genoegsame meganismes inhou om die risiko's van heridentifisering in ooreenstemming met hul verantwoordelikhede vir die bestuur van data te verminder. Boonop moet derdepartygebruikers gewaarsku word teen die etiese en potensiële regsgevolge van heridentifikasiepogings as gevolg van die skending van deelnemers se regte.

Regsmaatreëls en regeringsmeganisme

Benewens die heridentifikasierisiko's, kan die deel van persoonlike genomiese data risiko's inhou vir skade aan deelnemers. In hierdie verband, PLC en GNZ 'n lys met moontlike skade wat voortspruit uit die deel van persoonlike genetiese data in die openbaar, en noem dat die ontwikkelende aard van genomika -navorsing dit onmoontlik maak om die omvang van die risiko's of die omvang daarvan te voorspel. Sommige van die risiko's vir skade blyk baie afgeleë te wees, soos 'deur DNA -snare te sintetiseer en op 'n misdaadtoneel te plaas' deur kwaadwillige gebruikers. Ander voorbeelde, soos diskriminerende gebruik van data teen individue of hul familielede deur werkgewers of versekeringsmaatskappye, is egter binne die bereik. Alhoewel die moeite van projekte om data te deel om deelnemers openlik in te lig oor moontlike risiko's en ongemak nodig is, moet dit steeds gekombineer word met wetlike en etiese voorsorgmaatreëls as daar skade ly (Prainsack en Buyx 2013).

Die potensiële regsreaksies op die skade wat verband hou met die deel van persoonlike genomiese data verskil oor jurisdiksies. In terme van diskriminerende gebruike van data, bv. PLC en GNZ deelnemers in te lig dat bestaande wetlike beskerming dalk nie omvattend is nie. Soos dit in die Deelnemersinligtingsvorm (GNZ): "Alhoewel sommige lande wette het wat sekere vorme van genetiese diskriminasie verbied, is hierdie wette moontlik nie op u van toepassing nie, beskerm dit nie teen alle vorme van diskriminasie nie of kan dit nie 'n derde party weerhou om teen u te diskrimineer nie, selfs al is dit deur die wet verbied." . Dit kan die vraag laat ontstaan ​​oor die voldoende en doeltreffendheid van huidige wetlike en etiese voorsorgmaatreëls om deelnemers teen potensiële skade te beskerm (Weil et al. 2013). Dit is van kardinale belang, hoofsaaklik omdat die bestaande wetlike en etiese privaatheidsbeskermingsmaatreëls tekort kan skiet in die siening van vrywillige deel van persoonlike genomiese data en mediese rekords buite die vertroulike verhouding van navorsers-individue. “[. ] namate pasiënte meer bemagtig word om hul data te deel om groter mediese voordeel daaruit te verkry, en namate ons beweeg om meer naatloos te karteer tussen DNA en makliker verkrygbare hoë-dimensionele fenotipiese data om 'n groter diversiteit van menslike gedrag en siektes met groter gemak te voorspel risiko's, moet wette ook ontwikkel om te verseker dat die regte van pasiënte beskerm word. Die verskuiwing na ’n meer oop persoonlike data-omgewing en ’n groter deelname van ingeligte pasiënte sal dus met strenger en breër anti-diskriminasieregulasies gepaard gaan” (Schadt 2012).

Dit gesê, die inisieer van projekte vir die deel van persoonlike genomiese data ten spyte van die erkende tekortkominge in huidige wetlike voorsorgmaatreëls en bestuurs- en toesigmeganismes kan kommer wek oor die beskerming van navorsingsdeelnemers.

Deel van persoonlike genomiese data: Nie 'n heeltemal persoonlike besluit nie

Die oorerflike aard van genomiese data kan die persoonlike besluit om genetiese data te deel omskep in een met familiale gevolge. Soos in die Deelnemersinligtingsvorm, GNZ stel dit: “Alhoewel die gevolgtrekkings wat uit u publiek beskikbare inligting kan lei, in baie gevalle spekulatief kan wees ten opsigte van u en selfs minder voorspellend ten opsigte van u familielede, kan die volledige omvang en omvang van die risiko's wat die openbare beskikbaarheid is, van hierdie inligting inhou vir jou en jou familie is nie op hierdie tydstip bekend nie” q . In die besonder kan genomiese data-deelname deur individue 'n spektrum van onverwagte gesondheids- en nie-gesondheidsverwante inligting openbaar wat van belang is vir onmiddellike familielede. Deur byvoorbeeld publiek beskikbare persoonlike genetiese data te ontleed, kan derde partye die verhoogde of verminderde risiko's vir 'n siekte of ander eienskap onthul of lig werp op die geslagslyn en etnisiteit. Gevolglik kan hierdie inligting "die manier waarop individue hulself en hul familie van oorsprong beskou, verander" (Doukas en Berg 2001).

Ook in die raamwerk van PLC, word individue in kennis gestel dat die lys met risiko's en ongemak sowel deelnemers as hul familielede kan aanspreek. Die moontlike risiko's vir familielede word verder uiteengesit: 'As 'n privaatheidskending lei tot die bekendmaking van inligting rakende 'n oorerflike mutasie, kan hierdie inligting nie net die individuele navorsingsdeelnemer nie, maar ook ander geneties verwante mense benadeel. Onder sulke omstandighede kan die keuse van 'n individu om aan navorsing deel te neem groepsdiskriminasie of stigmatisering tot gevolg hê "(Weil et al. 2013).

In reaksie op hierdie kommer, beide GNZ en PLC moedig deelnemers sterk aan om die projek en relevante risiko's met hul naaste familielede te bespreek. Desondanks bestaan ​​daar op die oomblik geen meganisme om te verseker dat so 'n konsultasie plaasvind nie. Boonop word verwag dat die waarskynlike botsing van belange tussen familielede rakende die deel van genetiese data kommerwekkende kwessies van data -eienaarskap en omvang van privaatheidsregte na vore sal bring en verdere ondersoeke sou verg.

Beperkings van individue se beheer oor hul genomiese data

Om individue in beheer van hul data te plaas, word beskou as 'n herhalende tema in die bestudeerde projekte. In ooreenstemming met hierdie doelwit word deelnemers versoek om risiko's en voordele van die deel van persoonlike genomiese data individueel te balanseer in ooreenstemming met hul heterogene risiko-baat-voorkeure.

Om 'n ingeligte keuse te maak, moet individue in staat wees om die omvang en omvang van moontlike risiko's, soos privaatheidskendings, te begryp. Daar kan egter regmatig aangevoer word dat die uitvoer van sodanige risiko- en baatanalise voldoende kennis moet hê oor komplekse en tog onbekende potensiaal van die deel van persoonlike genomiese data, wat die algemene publiek kan ontbreek (Steinsbekk et al. 2013). “Deur toenemend groot databasisse te bou en sowel genetiese as uitgebreide fenotipiese inligting te versamel, kan daar egter later assosiasies gemaak word wat nie duidelik of voorspelbaar was nie, en dit kan bevindings wees (byvoorbeeld oor persoonlikheid of gedrag) wat 'n individu kan hê wou beskerm of verberg” (Esposito en Goodman 2009).

Kompleksiteite van die inligting wat uit genomiese data onttrek is, is geïllustreer in die geval van die publieke vrystelling van dr. James Watson se opeenvolgende genoom in 2008. In die loop van hierdie openbare vrystelling, op grond van dr. Watson se versoek, is al die geeninligting oor apolipoproteïen E (ApoE) is verwyder as gevolg van kommer oor die verband tussen hierdie geen en Alzheimer se laat siekte (LOAD). Ondanks die voorsorgmaatreëls, het 'n daaropvolgende studie gesuggereer dat die APOE -geeninligting nie uitgevee kan word om 'n risiko -voorspelling vir LOAD te voorkom nie: 'die verwydering van die APOE -geninligting kan moontlik nie 'n akkurate voorspelling van die risiko van dr Watson vir LOAD voorkom nie. deur APOE risiko -allele. Spesifiek kan koppelingsongelykheid (LD) tussen een of meer polimorfismes en APOE gebruik word om APOE -status te voorspel deur gebruik te maak van gevorderde berekeningshulpmiddels. Om genotipes by bekende risikofaktore bloot uit te steek, is dus oor die algemeen nie voldoende as die doel is om genetiese inligting by hierdie lokusse weg te steek nie” (Nyholt et al. 2009).

Die ondersoekde projekte vir die deel van persoonlike genomiese data poog om deelnemers vertroud te maak met die implikasies van hul bydrae deur middel van toestemming en die privaatheidsbeleidstellings. Dit is egter onduidelik of sulke dokumente voldoende is om individue in te lig oor moontlike risiko's van datadeling. Resultate van studies dui aan dat deelnemers dikwels probleme ondervind om langdurige toestemmingsvorms te verstaan, vertroulikheidskwessies te verstaan ​​en te onthou waarvoor hulle wel toegestem het (Ormond et al. 2009 Robinson et al. 2013). Dit was ook 'n uitdagende poging om privaatheidsbeleidverklarings te ontwerp om aan die inligtingsbehoeftes van deelnemers te voldoen en hul privaatheidsvoorkeure te spesifiseer. Soos Cranor et al.Let daarop dat die onderliggende redes vir sulke uitdagings die volgende kan insluit: "privaatheidsbeleid is kompleks, voorkeure van gebruikers se privaatheid is dikwels kompleks en genuanseerd, gebruikers het min ervaring om hul privaatheidsvoorkeure te verwoord; gebruikers is gewoonlik nie vertroud met die terminologie wat deur privaatheidskenners gebruik word nie. , en gebruikers verstaan ​​dikwels nie die privaatheidsverwante gevolge van hul gedrag nie ”(Cranor et al. 2006).

Vermoedelik het struikelblokke in die voldoende inligting van individue oor die deel van persoonlike data daartoe gelei dat sommige projekte hoogs opgeleide of meer gemotiveerde en bemagtigde individue teiken. Alternatiewelik kan van deelnemers vereis word om 'n "toelatingstoets" te slaag voordat hulle hul data wyd deel, 'n model wat gebruik word deur Persoonlike genoomprojek (Lunshof et al. 2008). Hierdie benadering is egter gekritiseer op grond daarvan dat die steekproef moontlik nie verteenwoordigend is van die hele samelewing as sodanig nie, wat 'n seleksievooroordeel opleg (Janssens en Kraft 2012).

Om die behoefte om deelnemers voldoende in te lig, aan te spreek, het sommige projekte vir die deel van persoonlike genomiese data na aanvullende meganismes verwys. Byvoorbeeld, GNZ moedig deelnemers aan om advies van hul dokter of ander gekwalifiseerde gesondheidsorgverskaffers in te win oor die implikasies van die deelname. 'n Waarskynlike tekort aan kennis en ervaring van algemene gesondheidsorgpersoneel in genetika kan egter sulke konsultasie belemmer. In hierdie verband het 'n opname onder verbruikers van direk-tot-verbruiker persoonlike genomika aangedui "die meerderheid deelnemers het gerapporteer dat hul gesondheidsorgverskaffer beperkte vermoë gehad het om te verstaan ​​en onvoldoende kundigheid om hul resultate te interpreteer" (Lee et al. 2013).

Verder is die opsie om data uit die navorsing te onttrek sentraal om in beheer van persoonlike genomiese data te wees. Deur data via die internet te deel, lê dit egter beduidende hindernisse in vir die volledige onttrekking van gedeelde data en kan die deel van persoonlike data 'n onherroeplike besluit maak.

Slotopmerkings

Die noodsaaklikheid tot breë genetiese datadeling word mettertyd sterker. Saam met die deel van data deur navorsers, nooi verskeie inisiatiewe individue uit om deel te neem aan die deel van persoonlike genomiese data. In daardie inisiatiewe word individue aangemoedig om beheer oor hul genetiese data te neem en webgebaseerde gereedskap te gebruik om hul data volgens hul privaatheidsgerief te deel. Daar word aangevoer dat individue deur middel van so 'n ingeligte keuse die risiko's en voordele van die deel van persoonlike genomiese data persoonlik sal balanseer (Karczewski et al. 2012). Nietemin, inherente beperkings op beheerbaarheid van genomiese data, sodra dit in die openbaar gedeel is, skep twyfel oor hierdie argument. Soos opgemerk, "... die idee om toestemming te gee vir die gebruik van data, verloor betekenis, wanneer die gebruik baie onbekende navorsers en toepassings vir ewig kan betrek. Sulke oop-einde gebruik van data maak die goed gevestigde reg om toestemming tot die insameling en gebruik van persoonlike data vir navorsing terug te trek betekenisloos” (Vayena et al. 2013). Boonop maak die ontwikkelende aard van genomika-navorsing dit moeilik om die omvang van inligting te voorspel wat in die toekoms uit opeenvolgende data onttrek kan word en die omvang van risiko's verbonde aan sulke openbaarmakings.

Sommige het beklemtoon dat dit noodsaaklik is om metodologiese beperkings van navorsing wat deur sekere inisiatiewe vir die deel van persoonlike data uitgevoer is, aan hul deelnemers te kommunikeer, en het gewys op die huidige tekortkominge in die uitvoering van hierdie taak (Janssens en Kraft 2012). Hierdie noodsaaklikheid moet uitgebrei word tot die voorsiening van 'n akkurate uiteensetting van beperkings wat verband hou met die bestuur van persoonlike genomiese data -deelingsprojekte en voorsorgmaatreëls om die regte van deelnemers te beskerm. Vir hierdie doel word voorgestel om voldoende kommunikasie-instrumente te gebruik om potensiële deelnemers in te lig oor sulke beperkings. Daardeur sou deelnemers 'n regverdige geleentheid kry om bestaande beperkings en risiko's in ag te neem in die lig van die beklemtoonde voordele van data -deling vir navorsing. Hierdie benadering sal uiteindelik lei tot 'n hoër vlak van deursigtigheid en vertroue onder deelnemers. Boonop hou die ontwikkelende potensiaal van genomika en bioinformatika die risiko's van heridentifisering en privaatheidskendings as bewegende teikens in, wat 'n deurlopende ondersoek vereis na die toereikendheid van die relevante wetlike en etiese voorsorgmaatreëls.

Gegewe die oorerflike aard van genomiese data, moet die deel van persoonlike genomiese data nie slegs as 'n persoonlike besluit uitgebeeld word nie, ongeag die moontlike gevolge vir familielede. Soos die Presidensiële Kommissie in die onlangse verslag opgemerk het, “Respek vir persone ondersteun om persone die geleentheid te gee om hul hele genoomvolgorde-inligting te deel vir wetenskaplike vooruitgang, onderhewig aan sterk basislyn privaatheidsbeskerming. Terselfdertyd het individue 'n verantwoordelikheid om hul privaatheid sowel as dié van ander te beskerm deur deeglike oorweging te gee aan hoe die deel van hul hele genoomvolgordedata in 'n publieke forum hulle kan blootstel aan ongewenste inbreuk op hul privaatheid en dié van hul onmiddellike familielede. Om onverskillig te wees vir die implikasies van die bekendmaking van sensitiewe data en inligting oor jouself, is om onverantwoordelik op te tree "(Presidensiële Kommissie vir die studie van bio -etiese kwessies 2012).

Eindnotas

b Europese Genoom-fenoom-argief. https://www.ebi.ac.uk/ega/. Besoek op 21 Maart 2015

c Maak die data vry. http://www.free-the-data.org/. Besoek op 21 Maart 2015

d Genomera. http://genomera.com/. Toegang op 21 Maart 2015

e Pasiënte soos ek. http://www.patientslikeme.com/. Besoek op 21 Maart 2015

f Toestemming tot navorsing. http://weconsent.us/informed-consent/. Besoek op 21 Maart 2015

g Genome Uitgerits. projek. http://genomesunzipped.org/project. Besoek op 21 Maart 2015

h Sage Bionetworks. http://sagebase.org/. Toegang op 21 Maart 2015

i Draagbare wettige toestemming. http://sagebase.org/category/portable-consent/. Toegang op 21 Maart 2015

j PLC-CGR-dokumente. https://github.com/plc-cgr/plc. Toegang op 21 Maart 2015

k Bevry die data. Leer meer. http://www.free-the-data.org/learn. Toegang op 21 Maart 2015

l Maak die data vry. Bevry my data. http://www.free-the-data.org/freemydata. Toegang op 21 Maart 2015

m Bevry die data. Vir klinici. http://www.free-the-data.org/clinicians. Besoek op 21 Maart 2015

n Maak die data vry. Oor ons. http://www.free-the-data.org/about. Toegang op 21 Maart 2015

o Persoonlike genoomprojek. http://www.personalgenomes.org/. Toegang op 21 Maart 2015

p 1000 Genome. http://www.1000genomes.org/. Besoek op 21 Maart 2015


Affiliasies

UCSD Health Department of Biomedical Informatics, Universiteit van Kalifornië, San Diego, La Jolla, CA, VSA

Luca Bonomi, Yingxiang Huang en Lucila Ohno-Machado

Afdeling Gesondheidsdienste Navorsing en Ontwikkeling, VA San Diego Healthcare System, San Diego, La Jolla, CA, VSA

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Bydraes

L.B. het die literatuuroorsig gedoen, die organisasie van die artikel opgestel en die meeste bygedra tot die skryfwerk. Y.H. het bygedra tot die afdelings oor datadeling in DTC -genetiese toetse en nuttige kommentaar gelewer op die aanbieding. L.O.-M. het die motivering vir hierdie werk verskaf en gedetailleerde wysigings en kritiese voorstelle oor die organisasie en struktuur van die artikel verskaf.

Ooreenstemmende skrywer


Kyk die video: SO TINY. MICRO BIKINI TRY ON HAUL (Oktober 2022).