Inligting

Waarskynlikhede in die berekening van die verwantskapskoëffisiënt

Waarskynlikhede in die berekening van die verwantskapskoëffisiënt


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ek het al opgelees om te probeer verstaan ​​hoe die verwantskapskoëffisiënt (of koëffisiënt van samekoms) bereken word. https://brainder.org/2015/06/13/genetic-resemblance-between-relatives/ dit is die beste verduideliking wat ek tot dusver kon kry. Ek kon egter nie 'n verduideliking vind wat 'n duidelike onderskeid tussen gene en allele maak nie.

In my aanvanklike lees van bogenoemde het ek hierdie feit in berekening gebring en aangeneem dat wanneer die skrywer geen geskryf het nie, hy/sy alleel bedoel het ('n aanname wat ek nou dink verkeerd is), en dus dat identiteit deur afkoms van 'n enkele alleel tussen individue genoeg wees om verwantskap te bevredig in die konteks van die definisie van die verwantskapskoëffisiënt. Dit het my tot verwarring gelei by die lees van die verwantskapskoëffisiënt soos wiskundig gedefinieer uit die gekondenseerde koëffisiënte van identiteit:

D1 + 1/2(D3+D5+D7) + 1/4(D8)

Sekerlik, het ek gedink, moet die verwantskapskoëffisiënt bloot die som van die waarskynlikhede wees van al die moontlike maniere waarop die twee individue dieselfde alleel kan deel. En dus is daar geen rede om die som van D3, D5 en D7 met 1/2 en D8 met 1/4 te vermenigvuldig nie.

Ten slotte by my vraag; Verwantskapskoëffisiënt word gedefinieer as die waarskynlikheid dat twee individue identies is deur afkoms by 'n enkele ewekansig geselekteerde geen. Om dit te onthou, is die rede waarom dit op hierdie manier bereken word, want ten einde die geen tussen individue ten volle identies te wees in die geval van D3, D5 en D7, word 'n bykomende identiese alleel van een ouer vereis ('n gebeurtenis met 'n waarskynlikheid) van 1/2), en in die geval van D8 word addisionele identiese allele van beide ouers vereis ('n gebeurtenis met 'n waarskynlikheid van 1/4)?

Ek sal baie dankbaar wees as iemand vir my kan verduidelik hoekom dit so bereken word.


Skat FST en verwantskap vir arbitrêre bevolkingstrukture

Affiliasies Duke Sentrum vir Statistiese Genetika en Genomika, Duke Universiteit, Durham, Noord-Carolina, Verenigde State van Amerika, Departement Biostatistiek en Bioinformatika, Duke Universiteit, Durham, Noord-Carolina, Verenigde State van Amerika

Rolle Konseptualisering, Formele analise, Befondsingverkryging, Ondersoek, Metodologie, Skryf – oorspronklike konsep, Skryf – hersien en redigering

Affiliasie Lewis-Sigler Instituut vir Integrerende Genomika, Princeton Universiteit, Princeton, New Jersey, Verenigde State van Amerika


Verhoudingsafleiding uit die genetiese data oor ouers of nageslag: 'n Vergelykende studie

Verwantskapafleiding in 'n populasie is van belang vir baie gebiede van navorsing, van antropologie tot genetika. Dit is moontlik om die verwantskap tussen die twee individue in 'n paartjie direk af te lei uit hul genetiese data of om dit indirek af te lei uit die genetiese data van een van hul nageslag. Om hierdie rede kan 'n mens wonder of dit meer voordelig is om paartjies of enkellopende individue te steekproef om verhoudings van paartjies in 'n populasie te bestudeer. Inderdaad, steekproefneming van twee individue is meer insiggewend as steekproefneming van een, aangesien ons na vier haplotipes in plaas van twee kyk, maar dit verdubbel ook die koste van die studie en is 'n meer komplekse steekproefskema.

Om hierdie vraag te beantwoord, het ons simulasies van 1000 trio's van 10 verskillende verhoudings uitgevoer deur regte menslike haplotipes te gebruik om realistiese genoomwye genetiese data te hê. Toe het ons die genoomdelingskoëffisiënte vergelyk en die verwantskapafleiding verkry van óf 'n paar individue óf een van hul nageslag met behulp van beide enkelpunt- en meerpuntbenaderings.

Ons het waargeneem dat vir verhoudings nader as 1ste neef, pare individue meer insiggewend was as een van hul nageslag vir verhoudingsafleiding, en verwantskapskoëffisiënte verkry vanaf enkelpuntmetodes het meer akkurate of ekwivalente genoomdelingskattings gegee. Vir meer afgeleë verwantskappe was nageslag meer insiggewend vir verwantskapsafleidings, en intelingkoëffisiënte verkry vanaf multipuntmetodes het meer akkurate genoomdelingskattings gegee.

Ten slotte, verhoudingsafleiding oor 'n ouerpaar of op een van hul nageslag verskaf aanvullende inligting. Waar moontlik, moet steekproeftrio's aangemoedig word, aangesien dit 'n wyer reeks potensiële verhoudings kan oorspan.


Padtelformules vir veralgemeende verwantskapskoëffisiënte en gekondenseerde identiteitskoëffisiënte.

Met die vinnig groeiende veld van mediese genetika en genetiese berading word genealogiese inligting al hoe meer volop. In Januarie 2009 het die Amerikaanse Departement van Gesondheid en Menslike Dienste 'n bygewerkte en verbeterde weergawe van die Chirurg-generaal se webgebaseerde hulpmiddel vir familiegesondheidsgeskiedenis vrygestel [1]. Hierdie webgebaseerde hulpmiddel maak dit maklik vir gebruikers om hul familiegesondheidsgeskiedenis aan te teken. Groot uitgebreide menslike stambome is baie insiggewend vir koppelingsanalise. Stambome wat duisende lede in 10-20 generasies insluit, is beskikbaar van geneties geïsoleerde bevolkings [2, 3]. In menslike genetika word 'n stamboom gedefinieer as "'n vereenvoudigde diagram van 'n familie se genealogie wat familielede se verhoudings met mekaar toon en hoe 'n spesifieke eienskap, abnormaliteit of siekte geërf is" [4]. Stambome word gebruik om die oorerwing van 'n spesifieke siekte op te spoor, genetiese risikoverhoudings te bereken, individue in gevaar te identifiseer en genetiese berading te fasiliteer. Om genetiese risikoverhoudings te bereken of individue in gevaar te identifiseer, moet ons die mate van verwantskap van twee individue bepaal. Trouens, alle maatstawwe van verwantskap is gebaseer op die konsep van identies deur afkoms (IBD). Twee allele is identies deur afkoms as een 'n voorvaderlike kopie van die ander is of as hulle albei kopieë van dieselfde voorvaderlike alleel is. Die IBD-konsep is hoofsaaklik te danke aan Cotterman [5] en Malecot [6] en is suksesvol toegepas op baie probleme in bevolkingsgenetika.

Die eenvoudigste maatstaf van verwantskap tussen twee individue is hul verwantskapskoëffisiënt. Die verwantskapskoëffisiënt tussen twee individue i en j is die waarskynlikheid dat 'n alleel wat lukraak gekies is uit i en 'n alleel wat lukraak geselekteer is uit dieselfde outosomale lokus van j identies is deur afkoms. Om beter te onderskei tussen verskillende tipes familiepare, is identiteitskoëffisiënte deur Gillois [7] en Harris [8] ingestel en deur Jacquard [9] gepromulgeer. Met inagneming van die vier allele van twee individue by 'n vaste outosomale lokus, is daar 15 moontlike identiteitstoestande. As ons die onderskeid tussen moederlik en vaderlik afgeleide allele verontagsaam, kry ons 9 gekondenseerde identiteitstoestande. Die waarskynlikhede wat met elke gekondenseerde identiteitstoestand geassosieer word, word gekondenseerde identiteitskoëffisiënte genoem, wat nuttig is in 'n uiteenlopende reeks velde. Dit sluit die berekening van risikoverhoudings vir kwalitatiewe siektes, die ontleding van kwantitatiewe eienskappe en genetiese berading in medisyne in.

'n Rekursiewe algoritme vir die berekening van gekondenseerde identiteitskoëffisiënte wat deur Karigl [10] voorgestel is, is al 'n geruime tyd bekend. Hierdie metode vereis dat 'n mens 'n stel algemene verwantskapskoëffisiënte bereken, waaruit 'n mens gekondenseerde identiteitskoëffisiënte via 'n lineêre transformasie verkry. Een beperking is dat hierdie rekursiewe benadering nie skaalbaar is wanneer dit op baie groot stambome toegepas word nie. Dit is voorheen getoon dat die verwantskapskoëffisiënte vir twee individue 11-13] en die algemene verwantskapskoëffisiënte vir drie individue [14, 15] doeltreffend bereken kan word deur gebruik te maak van padtelformules tesame met padenkoderingskemas wat vir stamboomgrafieke aangepas is.

Gemotiveer deur die doeltreffendheid van padtelformules vir die berekening van die verwantskapskoëffisiënt vir twee individue en die algemene verwantskapskoëffisiënt vir drie individue, stel ons eers 'n raamwerk bekend vir die ontwikkeling van padtelformules om veralgemeende verwantskapskoëffisiënte vir drie individue, vier individue, en twee pare individue. Dan bied ons padtelformules aan vir alle algemene verwantskapskoëffisiënte wat rekursiewe formules het wat deur Karigl [10] voorgestel is en voldoende is om gekondenseerde identiteitskoëffisiënte te bereken. Samevattend is ons uiteindelike doel om padtelformules te gebruik vir algemene verwantskapskoëffisiënte-berekening sodat doeltreffendheid en skaalbaarheid vir die berekening van gekondenseerde identiteitskoëffisiënte verbeter kan word.

Die belangrikste bydraes van ons werk is soos volg:

(i) 'n raamwerk om padtelformules vir algemene verwantskapskoëffisiënte te ontwikkel

(ii) 'n stel padtelformules vir alle algemene verwantskapskoëffisiënte met rekursiewe formules [10]

(iii) eksperimentele resultate wat beduidende prestasiewinste toon vir die berekening van gekondenseerde identiteitskoëffisiënte gebaseer op ons voorgestelde padtelformules in vergelyking met die gebruik van rekursiewe formules [10].

Hierdie afdeling beskryf verwantskapskoëffisiënte en algemene verwantskapskoëffisiënte, identiteitskoëffisiënte en gekondenseerde identiteitskoëffisiënte in meer besonderhede. Konseptuele terme vir die padtelformules vir drie en vier individue word in Afdeling 2.3 bekendgestel. Daarbenewens word 'n oorsig van padtelformule-afleiding aangebied.

2.1. Verwantskapskoëffisiënte en algemene verwantskapskoëffisiënte. Die verwantskapskoëffisiënt tussen twee individue a en h is die waarskynlikheid dat 'n willekeurig gekose alleel op dieselfde lokus van elkeen identies is deur afkoms (IBD). Daar is twee benaderings om die verwantskapskoëffisiënt [[PHI].sub.ab] te bereken: die rekursiewe benadering [10] en die padtelbenadering [16]. Die rekursiewe formules [10] vir [[PHI].sub.ab] en [[PHI].sub.ab] is

[[PHI].sub.ab] = 1/2([[PHI].sub.fb] + [[PHI].sub.mb]) as a nie 'n voorouer van b is nie, [[PHI].sub. aa] = 1/2 (1 + [[PHI].sub.fm]) = 2 1/2 (1 + [F.sub.a]), (1)

waar f en m onderskeidelik die vader en die moeder van a aandui, en [F.sub.a] die intelingskoëffisiënt van a is.

Wright se padtelformule [16] vir [[PHI].sub.ab] is

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII], (2)

waar A 'n gemeenskaplike voorouer van a en b is, is PP 'n stel nie-oorvleuelende padpare [??][P.sub.Aa], [P.sub.Aa][??] van A na a en b, r is die lengte van die pad [P.sub.Aa], s is die lengte van die pad [P.sub.Ab], en [F.sub.A] is die intelingskoëffisiënt van A. Die pad- paar [??][P.sub.Aa], [P.sub.Ab][??] is nie-oorvleuelend as en slegs as die twee paaie geen gemeenskaplike individue deel nie, behalwe A.

Rekursiewe formules voorgestel deur Karigl [10] vir algemene verwantskapskoëffisiënte met betrekking tot drie individue, vier individue en twee pare individue word soos volg in (3), (4) en (5) gelys:

[[PHI].sub.abc] = 1/2 + ([[PHI].sub.fbc] + [[PHI].sub.mbc]) as a nie 'n voorouer van b of c is nie,

[[PHI].sub.aab] = 1/2 ([[PHI].sub.ab] + [[PHI].sub.fmb])

as a nie 'n voorouer van b is nie,

[[PHI].sub.aaa] = 1/4 (1 + 3[[PHI].sub.fm]) = 1/4 (1 + 3[F.sub.a]) > [[PHI].sub .abcd] = 1/2 ([[PHI].sub.fbcd] + [[PHI].sub.mbcd]) (3)

as a nie 'n voorouer van b of c of d is nie,

[[PHI].sub.aabc] = 1/2 ([[PHI].sub.abc] + [[PHI].sub.fmbc])

as a nie 'n voorouer van b of c is nie,

[[PHI].sub.aaab] = 1/4 ([[PHI].sub.ab] + 3[[PHI].sub.fmb])

as a nie 'n voorouer van b is nie,

[[PHI].sub.aaaa] = 1/8 (1 + 7[[PHI].sub.fm]) = 1/8 (1 + 7[F.sub.a]), (4)

[[PHI].sub.ab,cd] = 1/2 ([[PHI].sub.fb,cd] + [[PHI].sub.mb,cd])

as a nie 'n voorouer van b of c of d is nie,

[[PHI].sub.aa,bc] = 1/2 ([[PHI].sub.bc] + [[PHI].sub.fm,bc])

as a nie 'n voorouer van b of c is nie,

[[PHI].sub.aa,ac] = 1/2 ([[PHI].sub.abc] + [[PHI].sub.fb,mc] + [[PHI].sub.mb,fc])

as a nie 'n voorouer van b of c is nie,

[[PHI].sub.aa,ab] = 2 ([[PHI].sub.ab] + [[PHI].sub.fmb])

as a nie 'n voorouer van b is nie,

[[PHI].sub.aa,aa] = 4 (l + [[PHI].sub.fm]) = 1/4 (1 + 3[F.sub.a]). (5)

[[PHI].sub.abc] is die waarskynlikheid dat willekeurig gekose allele op dieselfde lokus van elk van die drie individue (d.i. a, b en c) identies is deur afkoms (IBD). Net so is [[PHI].sub.abcd] die waarskynlikheid dat ewekansig gekose allele op dieselfde lokus van elk van die vier individue (d.w.s. a, b, c en d) IBD is. [[PHI].sub.ab,cd] is die waarskynlikheid dat 'n ewekansige alleel van a IBD is met 'n ewekansige alleel van b en dat 'n ewekansige alleel van c IBD is met 'n ewekansige alleel van d op dieselfde lokus. Let daarop dat [[PHI].sub.abc] = 0 as daar geen gemeenskaplike voorouer van a, b en c is nie. [[PHI].sub.abcd] = 0 as daar geen gemeenskaplike voorouer van a, b, c en d is nie, en [[PHI].sub.ab,cd] = 0 in die afwesigheid van 'n gemeenskaplike voorouer óf vir a en b of vir c en d.

2.2. Identiteitskoëffisiënte en Gekondenseerde Identiteitskoëffisiënte. Gegewe twee individue a en b met moederlik en vaderlik afgeleide allele by 'n vaste outosomale lokus, is daar 15 moontlike identiteitstoestande, en die waarskynlikhede wat met elke identiteitstoestand geassosieer word, word identiteitskoëffisiënte genoem. Deur die onderskeid tussen moederlik en vaderlik afgeleide allele te ignoreer, kategoriseer ons die 15 moontlike toestande na 9 gekondenseerde identiteitstoestande, soos getoon in Figuur 1. Die toestande wissel van toestand 1, waarin al vier allele IBD is, tot toestand 9, waarin geen van die vier allele is IBD. Die waarskynlikhede wat met elke gekondenseerde identiteitstoestand geassosieer word, word gekondenseerde identiteitskoëffisiënte genoem, aangedui deur <[DELTA].sub.i] | 1 [minder as of gelyk aan] i [minder as of gelyk aan] 9>. Die gekondenseerde identiteitskoëffisiënte kan bereken word gebaseer op veralgemeende verwantskapskoëffisiënte deur die lineêre transformasie wat soos volg in (6) getoon word, te gebruik:

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII]. (6)

In ons werk fokus ons op die afleiding van die padtelformules vir die algemene verwantskapskoëffisiënte, insluitend [[PHI].sub.abc], [[PHI].sub.abcd], en [[PHI].sub.ab, cd].

2.3. Bepalings omskryf vir padtelformules vir drie en vier individue

(1) Drievoudige gemeenskaplike voorouer. Gegewe drie individue a, b en c, as A 'n gemeenskaplike voorouer van die drie individue is, dan noem ons A 'n drievoudige gemeenskaplike voorouer van a, b en c.

(2) Quad-Gemeenskaplike Voorouer. Gegewe vier individue a, b, c en d, as A 'n gemeenskaplike voorouer van die vier individue is, dan noem ons A 'n quad-gemeenskaplike voorouer van a, b, c en d.

(3) P(A, a). Dit dui die stel van alle moontlike paaie van A na a aan, waar die paaie slegs rande in die rigting van ouer na kind kan deurkruis sodat P(A, a) [nie gelyk aan] NULL as en slegs as A 'n voorouer van a. [P.sub.Aa] dui 'n bepaalde pad van A na a aan, waar [P.sub.Aa] e P(A, a).

(4) Pad-paar. Dit bestaan ​​uit twee paaie, aangedui as [??][P.sub.Aa], [P.sub.Ab][??], waar [P.sub.Aa] [lid van] P(A, a) en [P.sub.Ab] [lid van] P(A, b).

(5) Nie-oorvleuelende Pad-paar. Gegewe 'n pad-paar [??][P.sub.Aa], [P.sub.Ab][??], is dit nie-oorvleuelend as en slegs as die twee paaie geen gemeenskaplike individue deel nie, behalwe A.

(6) Pad-Triple. Dit bestaan ​​uit drie paaie, aangedui as [??][P.sub.Aa], [P.sub.Ab] [P.sub.Ab][??], waar [P.sub.Aa] [lid van ] P(A, a), [P.sub.Ab] [lid van] P(A, b), en [P.sub.Ac] [lid van] P(A, c).

(7) Path-Quad. Dit bestaan ​​uit vier paaie, aangedui as [??][P.sub.Ab], [P.sub.Ab], [P.sub.Ac][??], [P.sub.Aa]>, waar [P.sub.Aa] [lid van] P(A, a), [P.sub.Ab] [lid van] P(A, b), [P.sub.Ac] [lid van] P(A) , c), en [P.sub.Ac] [lid van] P(A, d).

(8) BLC([P.sub.Aa], [P.sub.Ab]). Dit dui alle algemene individue aan wat gedeel word tussen [P.sub.Aa] en [P.sub.Ab], behalwe A.

(9) TrLC([P.sub.Aa], [P.sub.Ab], [P.sub.Ac]). Dit dui alle algemene individue aan wat gedeel word tussen [P.sub.Aa], [P.sub.Ab] en [P.sub.Ac], behalwe A.

(10) Quad_C([P.sub.Aa], [P.sub.Ab], [P.sub.Ac], [P.sub.Ad]). Dit dui alle algemene individue aan wat gedeel word tussen [P.sub.Aa], [P.sub.Ab], [P.sub.Ac] en [P.sub.Ad], behalwe A.

(11) Oorkruising en 2-oorvleueling individueel. As dit BLC([P.sub.Aa], [P.sub.Ab]) is, noem ons 'n kruising-individu met betrekking tot [P.sub.Aa] en [P.sub.Ab] as die twee paaie deurgaan verskillende ouers van s. Aan die ander kant, as [P.sub.Aa] en [P.sub.Ab] deur dieselfde ouer van s gaan, dan noem ons 'n 2-oorvleueling individu met betrekking tot [P.sub.Aa] en [P .sub.Ab].

(12) 3-oorvleueling Individueel. As s [lid van] Tri_C([P.sub.Aa], [P.sub.Ab], [P.sub.Ac]) en die drie paaie [P.sub.Aa], [P.sub.Ab ], en [P.sub.Ac] deur dieselfde ouer van s gaan, dan noem ons 'n 3-oorvleueling individu met betrekking tot [P.sub.Aa], [P.sub.Ab] en [P.sub] .Ac].

(13) 2-oorvleuelingpad. As s 'n 2-oorvleueling individu is met betrekking tot [P.sub.Aa] en [P.sub.Ab], dan gaan beide [P.sub.Aa] en [P.sub.Ab] deur dieselfde ouer van s, aangedui deur p, en die rand van p tot s word 'n oorvleuelingsrand genoem. Alle opeenvolgende oorvleuelingsrande vorm 'n pad en hierdie pad word 'n 2-oorvleuelingspad genoem. As die 2-oorvleuelingspad tot by die voorouer A strek, noem ons dit 'n wortel-2-oorvleuelingspad.

(14) 3-oorvleuelingpad. Dit bestaan ​​uit alle 3-oorvleuelende individue in 'n opeenvolgende volgorde. As die 3-oorvleuelingspad tot by die wortel A strek, noem ons dit 'n wortel 3-oorvleuelingspad.

Voorbeeld 1. Beskou die padpare van A na a en h in Figuur 2, waar A 'n gemeenskaplike voorouer van a en h is. Vir padpai[R.sub.1], BLC([P.sub.Aa], [P.sub.Ab]) = , en A [regspyl] s [regspyl] e [regspyl] t is 'n wortel 2-oorvleueling pad met betrekking tot [P.sub.Aa] en [P.sub.Ab]. Vir pad-paar4, Bi_C([P.sub.Aa], [P.sub.Ab]) = , waar e 'n oorkruis individu is t is 'n 2-oorvleueling individu met betrekking tot [P.sub.Aa] en [P.sub.Ab], en e [regspyltjie] t is 'n wortel 2-oorvleueling pad t.o.v. [P.sub.Aa] en [P.sub.Ab].

Voorbeeld 2.Daar is vier pad-kwads gelys in Figuur 3, van A tot vier individue a, h, c en d, waar A 'n vier-gemeenskaplike voorouer van die vier individue is. Vir pad-quad2, met inagneming van die paaie [P.sub.Aa] en [P.sub.Ab], is die pad A [regspyl] t [regspyl] f [regspyl] s 'n wortel 2-oorvleueling pad is 2-oorvleueling individue met betrekking tot [P.sub.Aa] en [P.sub.Ab]. Vir pad-quad3, is 3-oorvleueling individue met betrekking tot [P.sub.Aa], P^, en [P.sub.Ac], en die pad A [regspyl] t [regspyl] f [regspyl] s is 'n wortel 3-oorvleuel pad.

Dan som ons al die konseptuele terme op wat gebruik word in die padtelformules vir twee individue, drie individue en vier individue in Tabel 1 wat 'n blik op ons raamwerk vir veralgemening van Wright se formule na drie en vier individue uit terminologie-aspek openbaar.

2.4. 'n Oorsig van padtelling-formule-afleiding. Volgens Wright se padtelformule [16] (sien (2)) vir twee individue a en h, vereis die padtelbenadering die identifisering van gemeenskaplike voorouers van a en h en die berekening van die bydrae van elke gemeenskaplike voorouer tot [[PHI]. sub.ab]. Meer spesifiek, vir elke gemeenskaplike voorouer, aangedui as A, verkry ons alle pad-pare van A tot a en h en identifiseer aanvaarbare pad-pare. Vir [[PHI].sub.ab], 'n aanvaarbare pad-paar [??][P.sub.Aa], [P.sub.Ab][??] is 'n nie-oorvleuelende pad-paar waar die twee paaie deel geen algemene individue nie, behalwe A. In Figuur 2 is pad-pai[R.sub.2] 'n aanvaarbare pad-paar, terwyl padpai[R.sub.1], pad-pai[R.sub.3] en pad-paar4 is nie aanvaarbare padpare nie. Die bydrae van elke gemeenskaplike voorouer A tot [[PHI].sub.ab] word bereken op grond van die intelingkoëffisiënt van A, gewysig deur die lengte van elke aanvaarbare padpaar.

Om [[PHI].sub.abc te bereken, vereis die padtelbenadering die identifisering van alle drievoudige gemeenskaplike voorouers van a, b en c en die opsomming van alle drievoudige gemeenskaplike voorouers se bydraes tot [[PHI].sub.abc ]. Vir elke trippel-gemeenskaplike voorouer, aangedui as A, identifiseer ons eers alle pad-trippels wat elk uit drie paaie van onderskeidelik A na a, b en c bestaan. Enkele voorbeelde van pad-trippels word in Figuur 2 aangebied.

Vir [[PHI].sub.ab] is slegs nie-oorvleuelende padpare aanvaarbaar. 'n Pad-trippel [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] bestaan ​​uit drie pad-pare [??][P.sub. Aa], [P.sub.Ab][??] [??][P.sub.Aa], [P.sub.Ac][??] en [??][P.sub.Ab], [P.sub.Ac][??]. Vir [[PHI].sub.abc] kan 'n pad-trippel aanvaarbaar wees selfs al bestaan ​​daar óf 2-oorvleueling individue óf oorkruis individue tussen 'n pad-paar. Die hoofuitdaging wat ons moet aanspreek, is om nodige en voldoende toestande vir aanvaarbare pad-trippels te vind.

Met die doel om die probleem van die identifisering van aanvaarbare pad-trippels op te los, gebruik ons ​​eers 'n sistematiese metode om alle moontlike gevalle vir 'n pad-paar te genereer deur verskillende tipes algemene individue wat tussen die twee paaie gedeel word, te oorweeg. Dan stel ons boublokke bekend wat gekoppelde grafieke is met toestande aan elke rand in die grafiek wat 'n stel aanvaarbare gevalle van padpare insluit. In elke boublok verteenwoordig ons paaie as nodusse en interaksies (d.w.s. gedeelde gemeenskaplike individue tussen twee paaie) as rande. Daar is ten minste twee paadjies in 'n boublok. Vir elke boublok kry ons alle aanvaarbare gevalle vir betrokke padpare. Gegewe 'n pad-trippel, kan dit tot een of meer boublokke ontbind word. Met inagneming van 'n gedeelde pad-paar tussen twee boublokke, gebruik ons ​​die natuurlike koppelingsoperateur van relasionele algebra om die aanvaarbare gevalle vir die gedeelde pad-paar tussen twee boublokke te pas. Met ander woorde, met inagneming van die aanvaarbare gevalle vir boublokke as insette, gebruik ons ​​die natuurlike aansluitingsoperateur om alle aanvaarbare gevalle vir 'n pad-trippel te konstrueer. Aanvaarbare gevalle vir 'n pad-trippel word geïdentifiseer en dan gebruik om die pad-telformule vir [[PHI].sub.abc] af te lei.

Dan som ons al die hoofprosedures op wat gebruik word vir die afleiding van die padtelformule vir [[PHI].sub.abc] in 'n vloeidiagram wat in Figuur 4 getoon word. Die hoofprosedures is ook van toepassing vir die afleiding van die padtelformules vir [[ PHI].sub.abcd] en [[PHI].sub.ab,cd].

3.1. Paadtelformules vir drie individue. Ons stel eers 'n sistematiese metode bekend om alle moontlike gevalle vir 'n pad-paar te genereer. Dan bespreek ons ​​boustene vir pad-trippels en identifiseer alle aanvaarbare gevalle wat gebruik word om die pad-telformule vir [[PHI].sub.abc] af te lei.

3.1.1. Kasse vir 'n Paad-paar. Gegee 'n pad-paar [??][P.sub.Aa], [P.sub.Ab][??] met BL_C([P.sub.Aa], [P.sub.Ab]) [nie gelyk nie na] NULL, waar A 'n gemeenskaplike voorouer van a en b is en Bi_C([P.sub.Aa], [P.sub.Ab]) bestaan ​​uit alle gemeenskaplike individue wat gedeel word tussen [P.sub.Aa] en [P .sub.Ab], behalwe A, stel ons drie patrone bekend (dws kruising, 2-oorvleueling en wortel 2-oorvleueling) om alle moontlike gevalle vir [??][P.sub.Aa], [P.sub] te genereer .Ab][??].

(1) X([P.sub.Aa], [P.sub.Ab]): [P.sub.Aa] en [P.sub.Ab] deel een of meer oorkruis individue.

(2) T([P.sub.Aa], [P.sub.Ab]): [P.sub.Aa] en [P.sub.Ab] is wortel 2-oorvleuelend van A, en die wortel 2- oorvleuel pad kan een of meer 2-oorvleuel individue hê.

(3) Y([P.sub.Aa], [P.sub.Ab]): [P.sub.Aa] en [P.sub.Ab] oorvleuel maar nie vanaf A nie, en die 2-oorvleuelende pad kan een of meer 2-oorvleuelende individue hê.

Gebaseer op die drie patrone, X([P.sub.Aa], [P.sub.Ab]), en Y([P.sub.Aa], [P.sub.Ab]), gebruik ons ​​gereelde uitdrukkings om genereer alle moontlike gevalle vir die pad-paar [??][P.sub.Aa], [P.sub.Ab][??]. Gerieflikheidshalwe laat ons [??][P.sub.Aa], [P.sub.Ab][??] los en gebruik X, T en Y in plaas van patrone X([P.sub.Aa], [ P.sub.Ab]), T([P.sub.Aa], [P.sub.Ab]), en Y([P.sub.Aa], PM), wanneer daar geen verwarring is nie. Wanneer BLC([P.sub.Aa], [P.sub.Ab]) [nie gelyk aan] NULL, dek die agt gevalle in (7) alle moontlike gevalle vir [??][P.sub.Aa] , [P.sub.Ab][??]. Die volledigheid van agt gevalle getoon in (7) vir [??][P.sub.Aa], [P.sub.Ab][??] kan bewys word deur induksie op die totale aantal T, X en Y verskyn in [??][P.sub.Aa], [P.sub.Ab][??]. Deur die stamboom in Figuur 2 te gebruik, word Gevalle 1-3 en Geval 6 geïllustreer in (8), (9), (10) en (11):

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII], (7)

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII], (8)

waar is 2-oorvleuelende individue en die oorvleuelingspad is 'n wortel-2-oorvleuelingspad:

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII], (9)

waar s 'n 2-oorvleueling-individu is en die oorvleuelingspad 'n wortel-2-oorvleuelingspad is, is t 'n kruis-individu:

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII], (10)

waar t 'n oorkruis individu is:

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII], (11)

waar e 'n kruising-individu is, is t 'n 2-oorvleuelings-individu en die oorvleuelingspad 'n 2-oorvleuelingspad is.

3.1.2. Pad-paar-vlak grafiese voorstelling van 'n pad-trippel. Gegewe 'n pad-trippel [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??], stel ons elke pad as 'n nodus voor. Die pad-trippel kan tot drie pad-pare ontbind word (dws [??][P.sub.Aa], [P.sub.Ab][??], [??][P.sub.Aa] , [P.sub.Ac][??], en [??][P.sub.Ab], [P.sub.Ac] [??]). Vir elke pad-paar, as die twee paaie ten minste een gemeenskaplike individu deel (d.i. óf 2-oorvleueling individu óf kruising individu), behalwe A, dan is daar 'n rand tussen die twee nodusse wat die twee paaie verteenwoordig. Daarom kry ons vier verskillende scenario's [S.sub.0]-[S.sub.3], getoon in Figuur 5.

In Figuur 5 het die scenario S0 geen rande nie, so dit beteken dat [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] bestaan ​​uit drie onafhanklike paaie. In Figuur 2 is pad-trippel 'n voorbeeld van [S.sub.0]. Vervolgens stel ons 'n lemma bekend wat kan help met die identifisering van die opsies vir die rande in die scenario's [S.sub.1] - [S.sub.3].

Lemma 3. Gegee 'n pad-trippel [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??], beskou die drie pad-pare [??] [P.sub.Aa], [P.sub.Ab] [??], as daar 'n 2-oorvleuelingsrand is wat voorgestel word deur Y in gereelde uitdrukking voorstelling van enige van die drie padpare, en dan die pad -trippel [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] het geen bydrae tot [[PHI].sub.abc].

Bewys. In [17] het Nadot en Vaysseix voorgestel, vanuit 'n genetiese en biologiese oogpunt, dat [[PHI].sub.abc] geëvalueer kan word deur alle kwalifiserende oorerwingspaaie op alleelvlak op te som vanaf 'n driedubbele gemeenskaplike voorouer A tot die drie individue a, b en c.

Vir die stamboom in Figuur 6, kom ons kyk na die pad-trippel [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] wat soos volg gelys is. [P.sub.Aa] : A [regspyl] a [P.sub.Ab] : A [pyltjie regs] [p.sub.3] [regspyltjie] [P.sub.6] [regspyltjie] [ p.sub.7] [regspyltjie] b [P.sub.Ac] : A [regspyltjie] [p.sub.4] [regspyltjie] [p.sub.6] [regspyltjie] [p.sub. ,7] [regspyl] C.

Vir [??][P.sub.Ab], [P.sub.Ac][??], is [p.sub.6] 'n oorkruis individu, [p.sub.7] is 'n oorvleueling individu, en [p.sub.6] [regspyl] [p.sub.7] is 'n 2-oorvleuelingsrand wat deur Y in gereelde uitdrukkingsvoorstelling verteenwoordig word (sien die definisie vir Y in Afdeling 3.1.1).

Vir die individu [p.sub.6], laat ons die twee allele by een vaste outosomale lokus aandui as [g.sub.1] en [g.sub.2]. Op alleelvlak kan slegs een alleel van [p.sub.6] na [p.sub.7] oorgedra word. Aangesien [p.sub.3] en [p.sub.4] ouers van [p.sub.6] is, word [g.sub.1] van een ouer oorgedra, en [g.sub.2] is van die ander ouer oorgedra. Dit is onhaalbaar om beide [g.sub.1] en [g.sub.2] van [p.sub.6] na [p.sub.7] oor te dra. Met ander woorde, daar is geen ooreenstemmende oorerwingspaaie vir die pad-trippel [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] met 'n 2- oorvleuel rand tussen [??][P.sub.Ab], [P.sub.Ac][??] (dws Geval 6: XY). Daarom het so 'n soort pad-trippels geen bydrae tot [[PHI].sub.abc].

Figuur 6(b) toon een voorbeeld van geskikte oorerwingspaaie wat ooreenstem met 'n stamboomgrafiek. Elke individu word deur twee alleelknope voorgestel. Die kwalifiserende erfenispaaie in Figuur 6(b) bestaan ​​slegs uit rooi rande.

Slegs Geval 1, Geval 2 en Geval 3 het nie Y in die reëlmatige uitdrukking voorstelling van 'n pad-paar nie (sien (7)) met inagneming van die scenario's [S.sub.1]-[S.sub.3] wat in Figuur 5, 'n rand kan drie opsies hê .

3.1.3. Die bou van gevalle vir 'n Path-Triple. Vir die scenario's [S.sub.1]-[S.sub.3] in figuur 5, definieer ons twee boublokke <[B.sub.1], [B.sub.2]>saam met 'n paar reëls in figuur 7 aanvaarbare gevalle te genereer. Vir B3 kan die rand drie opsies hê . Vir [B.sub.2] kan ons nie toelaat dat beide rande worteloorvleuel nie, want as twee rande worteloorvleueling is, moet [P.sub.Aa] en [P.sub.Ac] ten minste een kom- mon individu, behalwe A, wat die feit weerspreek dat [P.sub.Aa] en [P.sub.Ac] geen rand het nie.

Vervolgens fokus ons op die generering van alle aanvaarbare gevalle vir die scenario's [S.sub.1]-[S.sub.3] in Figuur 5, waar slegs [S.sub.3] meer as een boublok bevat. Om die afhanklikheid tussen boustene te benut, ontbind ons [S.sub.3] na [S.sub.3] = <[u.sub.1] = [B.sub.2], [u.sub. 2] = [B.sub.2], [u.sub.3] = [B.sub.2]>, getoon in Figuur 8. Vir elke [u.sub.i], het ons 'n stel aanvaarbare pad -trippels, aangedui as [R.sub.i].

Met inagneming van die afhanklikheid tussen <[R.sub.1], [R.sub.2], [R.sub.3]>, gebruik ons ​​die natuurlike aansluitingsoperateur, aangedui as m, wat op <[R.sub.1] werk. ], [R.sub.2], [R.sub.3]> om alle aanvaarbare gevalle vir [S.sub.3] te genereer. As gevolg hiervan kry ons [T.sub.3] = [R.sub.1] [??] [R.sub.2] [??] [R.sub.3], waar [T.sub. 3] dui die aanvaarbare gevalle van die pad-trippel [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] in die scenario [S.sub. 3].

Vir elke scenario in Figuur 5 genereer ons alle aanvaarbare gevalle vir [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac] [??]. Die scenario S0 het geen rande nie, en dit wys dat [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] bestaan ​​uit drie onafhanklike paaie, terwyl, vir die ander scenario's [S.sub.k] (k = 1, 2, 3), kan die k rande twee opsies hê:

(1) alle k rande behoort aan kruising of

(2) een rand behoort aan wortel 2-oorvleuel die oorblywende (k-1) rande behoort aan kruising.

Samevattend kan aanvaarbare paddrielinge hoogstens een wortel 2-oorvleuelingspad hê, enige aantal kruisingsindividue, maar nul 2-oorvleuelingspad.

3.1.4. Splitsende operateur. Met inagneming van die bestaan ​​van wortel 2-oorvleueling pad en oorkruising in aanvaarbare pad-drievoudige, stel ons 'n splitsingsoperateur voor om 'n pad-trippel met oorkruis individue te transformeer na 'n nie-oorkruis pad-trippel sonder om die bydrae van hierdie pad-trippel na [[PHI] te verander ].sub.abc]. Die hoofdoel van die gebruik van die splitsingsoperateur is om die padtelformule-afleidingsproses te vereenvoudig. Ons gebruik eers 'n voorbeeld in Figuur 9 om te illustreer hoe die splitoperateur werk. In Figuur 9 is daar 'n oorkruising individu s tussen [P.sub.Aa] en PM in die pad trippel [??][P.sub.Ab], [P.sub.Ab], [P.sub.Ac ]) in [G.sub.k+1]] Die splitsingsoperateur gaan soos volg voort:

(1) verdeel die nodus s in twee nodusse, [s.sub.1] en [s.sub.2]

(2) transformeer die rande s [regspyl] a en s [regspyl] b' na [s.sub.1] [regspyl] a' en [s.sub.2] [regspyl] b', onderskeidelik

(3) voeg twee nuwe rande by, [s.sub.2] [regspyl] a' en [s.sub.1] [regspyl] b'.

Lemma 4. Gegee 'n stamboomgrafiek [G.sub.k+1] met (k + 1) oorkruis individue rakende [??][P.sub.Ac], [P.sub.Ab], [P.sub. Ac][??] wat in Figuur 9 getoon word, laat ons die laagste oorkruising-individu aandui, waar geen afstammeling van s 'n oorkruisingsindividu kan wees tussen die drie paaie [P.sub.Aa], [P.sub.Ab] en [P.sub.Ac]. Nadat die splitsingsoperateur vir die laagste oorkruisingindividue in [G.sub.k] + 1 gebruik is, word die aantal oorkruisindividue in [G.sub.k+1] met 1 verminder.

Bewys. Die splitoperateur beïnvloed slegs die rande van s na a' en b'. As daar 'n nuwe oorkruisknoop verskyn, is die enigste moontlike nodus óf a óf b. Gestel b word 'n kruising-individu, dit beteken dat b in staat is om a en b vanaf twee afsonderlike paaie te bereik. Dit weerspreek die feit dat s die laagste oorkruising individu tussen [P.sub.Aa] en [P.sub.Aa] is.

Vervolgens stel ons 'n kanonieke grafiek bekend wat voortspruit uit die toepassing van die splitsingsoperateur vir alle oorkruis individue. Die kanonieke grafiek het nul oorkruising individu.

Definisie 5 (Kanonieke Grafiek). Gegee 'n stamboomgrafiek G met een of meer oorkruisingindividue met betrekking tot [[PHI].sub.abc], Indien daar 'n grafiek G bestaan ​​wat geen kruisingindividue met betrekking tot [[PHI].sub.abc] het, sodat

(i) enige aanvaarbare pad-trippel in G het 'n aanvaarbare pad-trippel in G wat dieselfde bydrae tot [[PHI].sub.abc] het as die een in G vir [[PHI].sub.abc]

(ii) enige aanvaarbare pad-trippel in G' het 'n aanvaarbare pad-trippel in G wat en het dieselfde bydrae tot [[PHI].sub.abc] as die een in G' vir [[PHI].sub.abc ].

Ons noem G' 'n kanonieke grafiek van G met betrekking tot [[PHI].sub.abc].

Lemma 6. Vir 'n stamboomgrafiek G met een of meer oorkruis individue met betrekking tot [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??], bestaan ​​daar 'n kanonieke grafiek G vir G.

Bewys (Skets). Die bewys is deur induksie op die aantal crossover individue.

Induksiehipotese: aanvaar dat as G k of minder oorkruisings het, daar 'n kanoniese grafiek G' vir G is.

In die induksiestap, laat [G.sub.k+1] 'n grafiek wees met k + 1 oorkruisings laat s die laagste oorkruising wees tussen paaie [P.sub.Aa] en [P.sub.Ab] in [G. sub.k+1]. Ons pas die splitsingsoperateur op s in Gk+1 toe en verkry [G.sub.k] met k oorkruisings deur Lemma 4.

3.1.5. Padtelformule vir [[PHI].sub.abc]. Nou, ons bied die pad-tel formule vir [[PHI].sub.abc]:

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII], (12)

waar [[PHI].sub.aa] - (1/2)(1 + [F.sub.A]), [[PHI].sub.AAA] - (1/4)(1 + 3[F. sub.A]), [F.sub.A]: die intelingskoëffisiënt van A, A: 'n drievoudige gemeenskaplike voorouer van a, h en c, Tipe 1: ([P.sub.Aa], [P. sub.Ab], [P.sub.Ac]) het nulwortel 2-oorvleueling, Tipe 2: [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac] [??] het een wortel 2-oorvleueling pad PA's wat eindig by die individuele s

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII], (13)

en [WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII] die lengte van die pad [P.sub.Aa] (ook van toepassing vir [P.sub.Aa], [P.sub.Ac] en [P.sub.As]) .

Vir volledigheid word die padtelformule vir [[PHI].sub.aab] in Bylaag A gegee en die korrektheidsbewys van die padtelformule word in Bylaag B gegee.

3.2. Paadtelformules vir vier individue

3.2.1. Pad-paar vlak grafiese voorstelling van [??][[PHI].sub.Aa], [P.sub.Ab], [P.sub.Ac], [P.sub.Ad][??]. Gegee 'n pad-kwad [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac], [P.sub.Ad][??] en Quad_C([P. sub.Aa], [P.sub.Ab], [P.sub.Ac], [P.sub.Ad]) - 0, die pad-kwad kan 11 scenario's hê [S.sub.0]-[S .sub.10] getoon in Figuur 10 waar al vier paaie simmetries beskou word.

In Figuur 11 stel ons drie boublokke <[B.sub.1], [B.sub.2], [B.sub.3]> bekend. Vir [B.sub.1] en [B.sub.2] is die reëls wat in Figuur 7 aangebied word, ook van toepassing op Figuur 11. Vir [B.sub.3] oorweeg ons slegs worteloorvleueling, omdat die oorkruis individue kan uitgeskakel word deur die splitsingsoperateur te gebruik wat in Afdeling 3.1.4 bekendgestel is. Let daarop dat vir [B.sub.3] as Tr_C([P.sub.Aa], [P.sub.Ab], [P.sub.Ac]) - 0 dan is dit gelykstaande aan die scenario [S.sub .3] in Figuur 8 Daarom hoef ons slegs [B.sub.3] te oorweeg wanneer Tr_C([P.sub.Aa], Pap, [P.sub.Ac]) - 0.

3.2.2. Boublok-gebaseerde sake-konstruksie vir [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac], [P.sub.Ad][??]. Vir 'n scenario [S.sub.] (0 [minder as of gelyk aan] i [minder as of gelyk aan] 10) in Figuur 11, ontbind ons eers [S.sub.i] tot een of meer boublokke.Vir 'n scenario [S.sub.i] [lid van] <[S.sub.1], [S.sub.3]>, het dit slegs een bousteen, en alle aanvaarbare gevalle kan direk verkry word. Vir [S.sub.2] - <[u.sub.1] = [B.sub.1], [u.sub.2] - [B.sub.1]> is dit nie nodig om die konflik tussen die rande in [u.sub.1] en [u.sub.2] omdat [u.sub.1] en [u.sub.2] ontkoppel is. Laat [R.sub.i] alle aanvaarbare gevalle van die padpare in [u.sub.i] aandui en laat [T.sub.i] alle aanvaarbare gevalle vir [S.sub.i] aandui. Daarom verkry ons [T.sub.2] - [R.sub.1] x [R.sub.2] waar x die Cartesiese produkoperateur van relasionele algebra aandui.

Vir [S.sub.6] = <[u.sub.1] = [B.sub.3]> kry ons [T.sub.6] = [R.sub.1]. Vir [S.sub.i] [lid van] <[S.sub.i] | 4 [minder as of gelyk aan] i [minder as of gelyk aan] 10 en i [nie gelyk aan] 6>, definieer ons die grootste subgrafiek van [S.sub.i] op grond waarvan ons [T.sub. ek].

Definisie 7 (Grootste subgrafiek). Gegewe 'n scenario [S.sub.i] (4 [minder as of gelyk aan] i [minder as of gelyk aan] 10 en i [nie gelyk aan] 6), die grootste subgrafiek van [S.sub.i], aangedui as [S.sub.j] word soos volg gedefinieer:

(1) [S.sub.j] is 'n behoorlike subgrafiek van [S.sub.i]

(2) indien [S.sub.i] [B.sub.3] bevat, dan moet [S.sub.j] ook B3 bevat

(3) geen sodanige [S.sub.k] bestaan ​​dat [S.sub.j] 'n behoorlike subgraaf van [S.sub.k] is nie, terwyl [S.sub.k] ook 'n behoorlike subgraaf van [S.sub.k] is. sub.i].

Vir elke scenario [S.sub.i] (4 [minder as of gelyk aan] i [minder as of gelyk aan] 10 en i = 6), lys ons die grootste subgrafiek van [S.sub.i], aangedui as [S.sub.j] in Tabel 2.

Vir 'n scenario [S.sub.i] (4 [minder as of gelyk aan] i [minder as of gelyk aan] 10 en i = 6), laat Diff([S.sub.i] [S.sub. j]) dui die stel boublokke in [S.sub.i] aan maar nie in [S.sub.j] nie, waar [S.sub.j] die grootste subgrafiek van [S.sub.i] is. Laat [absolute waarde van [E.sub.i]] en [absolute waarde van [E.sub.j]] die aantal rande in [S.sub.i] en [S.sub.j] onderskeidelik aandui. Volgens Tabel 2 kan ons tot die gevolgtrekking kom dat [absolute waarde van [E.sub.i]] en [absolute waarde van [E.sub.j]] = 1. Om die afhanklikheid tussen boublokke te benut, oorweeg ons slegs [B.sub.2] in Diff([S.sub.i][S.sub.j]). Byvoorbeeld, Diff([S.sub.5][S.sub.3]) = <[B.sub.2]>. Laat [T.sub.3] alle aanvaarbare gevalle vir [S.sub.3] aandui. En laat [R.sub.1] die stel aanvaarbare gevalle vir Diff([S.sub.5] [S.sub.3]) aandui. Dan kan ons [S.sub.3] en Diff([S.sub.5] [S.sub.3]) gebruik om alle aanvaarbare gevalle vir [S.sub.5] te konstrueer. Dan pas ons hierdie idee toe om alle aanvaarbare gevalle vir elke [S.sub.i] in Tabel 2 te konstrueer.

Gegewe 'n pad-kwad [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac], [P.sub.Ad] [??], het 'n aanvaarbare geval die volgende eienskappe:

(1) as daar een wortel 3-oorvleueling pad is, kan daar hoogstens een wortel 2-oorvleueling pad wees

(2) anders kan daar hoogstens twee wortel 2-oorvleuelingspaaie wees.

3.2.3. Padtelformule vir [[PHI].sub.abcd]. Nou stel ons die pad-telformule vir [[PHI].sub.abcd] soos volg voor:

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII], (14)

waar [[PHI].sub.AA] = (1/2)(1 + [F.sub.A]), [[PHI].sub.AAA] = (1/4)(1 + 3[F. sub.A]), [[PHI].sub.AAA] = (1/8)(1 + 7[F.sub.A]), [F.sub.A]. die intelingkoëffisiënt van A, A: 'n quad-gemeenskaplike voorouer van a, b, c en d, Tipe 1: nulwortel 2-oorvleueling en nulwortel 3-oorvleuelingspad, Tipe 2: eenwortel 2-oorvleuelingspad PA's eindigend by s

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII], (15)

en [WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII] die lengte van die pad [P.sub.Aa] (ook van toepassing vir [P.sub.Ab], [P.sub.Ac], [P.sub.Ad]'ens ).

Vir volledigheid word die padtelformules vir [[PHI].sub.aabc] en [[PHI].sub.aaab] in Bylaag A aangebied. Die korrektheid van die padtelformule vir vier individue word in Bylaag C bewys .

3.3. Paadtelformules vir twee pare individue

3.3.1. Terminologie en definisies

(1) 2-paar-pad-paar. Dit bestaan ​​uit twee pare padpare wat aangedui word as [??]([P.sub.Sa], [P.sub.Sb]), ([P.sub.Tc], [P.sub.Td]) [??], waar [P.sub.Sa] [lid van] P(S, a), [P.sub.Sb] [lid van] P(S, b), [P.sub.Tc] [ lid van] P(T, c), [P.sub.Td] [lid van] P(T, d), S is 'n gemeenskaplike voorouer van a en b, en T is 'n gemeenskaplike voorouer van c en d. As A = S = T, dan is A 'n quad-algemene voorouer van a, b, c en d.

(2) Homo-oorvleueling en heter-oorvleueling individueel. Gegee twee pare individue [??]a,b[??] en [??]c,d[??], indien s [lid van] BLC([P.sub.Aa], [P.sub. Ab]) (of s [lid van] BLC([P.sub.Ac], [P.sub.Ad]), noem ons 'n homo-oorvleueling individu wanneer [P.sub.Aa] en (of [P. sub.Ac] en [P.sub.Ad]) gaan deur dieselfde ouer van a. Indien r [lid van] Bi_C([P.sub.Ai], [P.sub.Aj]), waar ek [lid] van] en j [lid van] , noem ons r 'n heter-oorvleueling individu wanneer [P.sub.Ai] en [P.sub.Aj] deur dieselfde ouer van r gaan.

(3) Wortel Homo-oorvleueling en Heter-oorvleuelingpad. Gegee 'n 2paar-pad-paar [??]([P.sub.Aa], [P.sub.Ab], ([P.sub.Ac], [P.sub.Ad])[??], as s 'n homo-oorvleueling individu is en die homo-oorvleuelingpad strek tot by die quad-gemeenskaplike voorouer A, dan noem ons dit 'n wortel homo-oorvleuelingpad As r 'n heter-oorvleueling individu is en die heter-oorvleueling pad strek tot by die quad-common-voorouer A, dan noem ons dit 'n wortel heter-oorvleueling pad.

Voorbeeld 8. A is quad-gemeenskaplike voorouer vir a, b, c en d in Figuur 12. Vir (a) is s 'n homo-oorvleueling individu tussen [P.sub.Aa] en [P.sub.Ab] .

t is 'n homo-oorvleueling individu tussen [P.sub.Ac] en [P.sub.Ad]. En, A [pyltjie regs] s en A [pyltjie regs] t is wortel homo-oorvleuel paaie. Vir (b) is x 'n heter-oorvleueling individu tussen [P.sub.Aa] en [P.sub.Ad]. y is 'n heter-oorvleueling individu tussen [P.sub.Ab] en [P.sub.Ac]. En A [pyltjie regs] x en A [pyltjie regs] y is wortel-heter-oorvleuelingspaaie.

3.3.2. Padtelformule vir [[PHI].sub.ab,cd]. Nou bied ons 'n pad-paar vlak grafiese voorstelling vir [??]([P.sub.Aa], [P.sub.Ab]), ([P.sub.Ac], [P.sub.Ad] ) [??] getoon in Figuur 13. Die opsies vir 'n rand kan wees . (Verwys na Afdeling 3.1.1 vir definisies van T, X en TX). Gebaseer op die verskillende tipes [??] [P.sub.Aa], [P.sub.Ab], [P.sub.Ac], [P.sub.Ad][??] aangebied in (14) , word alle gevalle vir <([P.sub.Aa], [P.sub.Ab]),([P.sub.Ac], [P.sub.Ad])) opgesom in Tabel 3, waar h is die laaste individu van 'n wortel-homo-oorvleuelingspad [P.sub.Ali] (dws die pad [P.sub.Ah] wat op h eindig) en [r.sub.1] en [r.sub.2] is die laaste individue van wortel heter-oorvleuel paaie [P.sub.Ar1] en [P.sub.Ar2], onderskeidelik.

Gegee 'n stamboomgrafiek met een of meer stamvaders <[p.sub.i] | i > 0>, definieer ons dat die generasie van 'n stamvader

[p.sub.i] is 0, aangedui as gen([p.sub.i]) = 0. As 'n individu a net een ouer p het, dan definieer ons gen(a) = gen(p) + 1. As 'n individu a twee ouers f en m het, definieer ons gen(a) = MAX + 1.

Die padtelformule vir [[PHI].sub.ab,cd] is soos volg:

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII], (16)

waar A: 'n quad-gemeenskaplike voorouer van a, b, c en d, S: 'n gemeenskaplike voorouer van a en b, en T: 'n gemeenskaplike voorouer van c en d. Vir [??][P.sub.Aa], [P.sub.Ab]), ([P.sub.Ac], [P.sub.Ad])[??] (S = T = A) , daar is vier tipes (dws Tipe 1 tot Tipe 4).

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII]. (17)

Tipe 4: een wortel homo-oorvleueling [P.sub.Ah] wat eindig op h en twee wortel heter-oorvleueling wat eindig op [r.sub.1] en [r.sub.2], en h = [r.sub. 1] = [r.sub.2]. Vir (([P.sub.Sa], [P.sub.Sb]), ([P.sub.Tc], [P.sub.Td])) (S = T), is daar een tipe (bv. , Tipe 5).

Tipe 5: [??][P.sub.Sb], [P.sub.Sb] [??] het geen oorvleueling individu, [??][P.sub.Tc], [P.sub.Td] [??] het geen oorvleueling individu nie.

Hoogstens een pad-paar (óf [??][P.sub.Sa], [P.sub.Sb][??] of [??][P.sub.Tc], [P.sub.Td ] [??]) kan oorkruis individue hê.

Tussen 'n pad vanaf [??][P.sub.Sa], [P.sub.Sb][??] en 'n pad vanaf [??][P.sub.Tc], [P.sub.Td] [??], daar is geen individue wat oorvleuel nie, maar daar kan oorkruising individue wees, x, waar x = S en x = T:

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII]. (18)

Let daarop dat as (a, b) en (c, d) nul quad-algemene voorouers het, ons die volgende formule vir [[PHI].sub.ab,cd] het:

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII]. (19)

Tipe 6: [??][P.sub.Sa], [P.sub.Sb][??] is 'n nie-oorvleuelende pad-paar en [??][P.sub.Tc], [P.sub. Td][??] is 'n nie-oorvleuelende pad-paar. Tussen 'n pad vanaf [??][P.sub.Sa], [P.sub.Sb][??] en 'n pad vanaf [??][P.sub.Tc], [P.sub.Td] [??], daar is geen oorvleuelende individue nie, maar daar kan oorkruising individue wees.

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII] word gedefinieer soos in Tipe 5

Die korrektheid van die padtelformule vir [[PHI].sub.ab.cd] word in Bylaag C bewys. Vir volledigheid, verwys asseblief na [18] vir die padtelformules vir [[PHI].sub.aa ,bc], [[PHI].sub.ab,ac], [[PHI].sub.ab,ab], en [[PHI].sub.aa,ab]

3.4. Eksperimentele resultate. In hierdie afdeling wys ons die doeltreffendheid van ons pad-telmetode deur NodeCodes vir gekondenseerde identiteitskoëffisiënte te gebruik deur vergelykings te tref met die prestasie van 'n rekursiewe metode wat in [10] gebruik word. Ons het twee metodes geïmplementeer: (1) die gebruik van rekursiewe formules om elke vereiste verwantskapskoëffisiënt en veralgemeende verwantskapskoëffisiënt te bereken (2) met behulp van padtelmetode tesame met NodeKodes om elke vereiste verwantskapskoëffisiënt en algemene verwantskapskoëffisiënt onafhanklik te bereken. Ons verwys na die eerste metode as Rekursief, die tweede metode as NodeCodes. Vir volledigheid, verwys asseblief na [18] vir die besonderhede van die NodeCodes-gebaseerde metode.

Nodekodes van 'n nodus is 'n stel etikette wat elkeen 'n pad na die nodus vanaf sy voorouers verteenwoordig. Gegewe 'n stamboomgrafiek, laat r die stamvader wees (d.w.s. die nodus met 0 in-graad). (Vir eenvoud neem ons aan daar is een stamvader, r, as die voorouer van alle individue in die stamboom. Andersins kan 'n virtuele nodus r by die stamboomgrafiek gevoeg word en alle stamvaders kan kinders van r gemaak word.) Vir elke nodus u in die grafiek word die stel knoopkodes van u, aangedui as NC(w), toegewys deur gebruik te maak van 'n breedte-eerste-soektog deurloop vanaf r soos volg.

(1) As u r is, bevat NC(r) slegs een element: die leë string.

(2) Andersins, laat u anode wees met NC(w), en [v.sub.0], [v.sub.1], . [v.sub.k] wees ons kinders in broer of suster, dan word vir elke x [minder as of gelyk aan] NC(m), 'n kode [xi.sup.*] by NC(v) gevoeg, waar 0 < i [minder as of gelyk aan] k, en * dui die geslag aan van die individu wat deur nodus [v.sub.i] verteenwoordig word.

Berekeninge van verwantskapskoëffisiënte vir twee individue en algemene verwantskapskoëffisiënte vir drie individue wat in [11, 12, 14, 15] aangebied word, gebruik NodeKodes. Die NodeKodes-gebaseerde berekeningskemas kan ook toegepas word vir die algemene verwantskapskoëffisiënte vir vier individue en twee pare individue. Vir volledigheid, verwys asseblief na [18] vir die besonderhede wat NodeCodes gebruik om die algemene verwantskapskoëffisiënte vir vier individue en twee pare individue te bereken, gebaseer op ons voorgestelde padtelformules in Afdelings 3.2 en 3.3.

Om die skaalbaarheid van ons benadering vir die berekening van gekondenseerde identiteitskoëffisiënte op groot stambome te toets, het ons 'n bevolkingsimulator gebruik wat in [11] geïmplementeer is om arbitrêr groot stambome te genereer. Die bevolkingsimulator is gebaseer op die algoritme vir die generering van bevolkings met oorvleuelende generasies in Hoofstuk 4 van [19] saam met die parameters gegee in Bylaag B van [20] om die relatief geïsoleerde Finse Kainuu-subbevolking en sy groei gedurende die jare 1500-2000 te modelleer . 'n Oorsig van die generasie-algoritme is in [11,12,14] aangebied. Die parameters sluit in begin-/eindjaar, aanvanklike bevolkingsgrootte, aanvanklike ouderdomsverspreiding, huwelikswaarskynlikheid, maksimum ouderdom tydens swangerskap, verwagte aantal kinders volgens tydperk, immigrasiekoers en waarskynlikheid van dood volgens tydperk en ouderdomsgroep.

Ons ondersoek die prestasie van gekondenseerde identiteitskoëffisiënte deur gebruik te maak van twaalf sintetiese stambome wat wissel van 75 individue tot 195 197 individue. Die kleinste stamboom strek oor 3 generasies, en die grootste stamboom strek oor 19 generasies. Ons het die uitwerking van stamboomgrootte en die diepte van individue in die stamboom (die langste pad tussen die individu en 'n stamvader) op die verbetering van berekeningsdoeltreffendheid ontleed.

In die eerste eksperiment is 300 ewekansige pare uit elk van ons 12 sintetiese stambome gekies. Figuur 14 toon die verbetering van berekeningsdoeltreffendheid vir elke stamboom. Soos gesien kan word, het die verbetering van NodeKodes bo Rekursief al hoe groter geword namate die stamboomgrootte toegeneem het, van 'n vergelykbare hoeveelheid van 26.83% op die kleinste stamboom tot 94.75% op die grootste stamboom. Dit wys ook dat padtelmetode tesame met NodeCodes baie goed kan skaal op groot stambome in terme van die berekening van gekondenseerde identiteitskoëffisiënte.

In ons volgende eksperiment het ons die effek van die diepte van die individu in die stamboom op die navraagtyd ondersoek. Vir elke diepte het ons 300 ewekansige pare uit die grootste sintetiese stamboom gegenereer.

Figuur 15 toon die effek van diepte op die verbetering van die berekeningsdoeltreffendheid. Ons kan die verbetering van NodeCodes oor Rekursief sien, wat wissel van 86,48% tot 91,30%.

Ons het 'n raamwerk ingestel om Wright se padtelformule vir meer as twee individue te veralgemeen. Met die doel om gekondenseerde identiteitskoëffisiënte doeltreffend te bereken, het ons padtelformules (PCF) voorgestel vir alle algemene verwantskapskoëffisiënte waarvoor voldoende is om gekondenseerde identiteitskoëffisiënte deur 'n lineêre kombinasie uit te druk. Ons doen ook eksperimente om die doeltreffendheid van ons metode te vergelyk met die rekursiewe metode vir die berekening van gekondenseerde identiteitskoëffisiënte op groot stambome. Ons toekomstige werk sluit in (i) verdere verbeterings op berekening van gekondenseerde identifiseerkoëffisiënte deur gesamentlik die stel algemene verwantskapskoëffisiënte te bereken om oortollige berekeninge te vermy, en (ii) eksperimentele resultate vir die gebruik van PCF in samewerking met enkoderingskemas (bv. kompakte pad-enkoderingskemas) [13]) vir die berekening van gekondenseerde identiteitskoëffisiënte op baie groot stambome.

A. Paadtelformules van spesiale gevalle

A.1. Padtelformule vir [[PHI].sub.aa,ab]. Vir [??][P.sub.Aa1], [P.sub.Aa2][??], stel ons 'n spesiale geval voor, waar [P.sub.Aa1] en [P.sub.Aa2] saamsmeltbaar is.

Definisie A.1 (Saamvoegbare Pad-paar). 'n Pad-paar [??][P.sub.Aa1], [P.sub.Aa2][??] is saamsmeltbaar as en slegs as die twee paaie [P.sub.Aa1] en [P.sub.Aa2] ] is heeltemal identies.

Vervolgens bied ons 'n grafiese voorstelling van [??][P.sub.Aa1], [P.sub.Aa2], [P.sub.Ab][??] in Figuur 16.

Lemma A.2. Vir [S.sub.2] en [S.sub.3] in Figuur 16 kan [??][P.sub.Aa1], [P.sub.Aa2][??] nie 'n saamsmeltbare pad-paar wees nie .

Bewys. Vir [S.sub.2] en [S.sub.3], as [??][P.sub.Aa1], [P.sub.Aa2]) saamsmeltbaar is, dan is enige algemene individuele s tussen [P. sub.Aa1] en [P.sub.Ab] is ook 'n gedeelde individu tussen [P.sub.Aa]2 en [P.sub.Ab]. Dit beteken s [lid van] Tri_C([P.sub.Aa1], [P.sub.Aa2], [P.sub.Ab]) wat die feit weerspreek dat Tri_C([P.sub.Aa1], [P .sub.Aa2], [P.sub.Ab]) = 0.

Met inagneming van al drie scenario's in Figuur 16, kan slegs S1 'n saamsmeltbare pad-paar hê [??][P.sub.Aa1], [P.sub.Aa2][??] deur Lemma A.2. Nou, ons bied ons pad-tel formule vir [[PHI].sub.aab] waar a nie 'n voorouer van b is nie:

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII], (A.1)

waar A: 'n gemeenskaplike voorouer van a en b.

Wanneer [??][P.sub.Aa1], [P.sub.Aa2][??] nie saamsmeltbaar is nie,

Tipe 1: [??][P.sub.Aa1], [P.sub.Aa2], [P.sub.Ab][??] het geen wortel 2-oorvleueling nie.

Tipe 2: [??][P.sub.Aa1], [P.sub.Aa2], [P.sub.Ab][??] het een wortel-2-oorvleuelingspad [P.sub.As] wat eindig by die individu s.

Wanneer [??][P.sub.Aa1], [P.sub.Aa2][??] saamsmeltbaar is, Tipe 3: [??][P.sub.Aa], [P.sub.Ab][ ??] is 'n nie-oorvleuelende pad-paar

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII]. (A.2)

Volledigheidshalwe, as a 'n voorouer van b is, is daar geen rekursiewe formule vir [[PHI].sub.aab] in [10], maar ons kan óf die rekursiewe formule vir [[PHI].sub gebruik. abc] of die padtelformule vir [[PHI].sub.abc] om [[PHI].sub.a1a2b] te bereken.

A.2. Padtelformule vir [[PHI].sub.aabc]. Gegee 'n pad-kwad [??][P.sub.Aa1], [P.sub.Aa2] [P.sub.Ab], [P.sub.Ac][??], indien [??][ P.sub.Aa1], [P.sub.Aa2][??] is nie saamsmeltbaar nie, dan verwerk ons ​​die pad-kwad as ekwivalent aan [??][P.sub.Aa], [P.sub.Ab ], [P.sub.Ac], [P.sub.Ad][??]. As [??][P.sub.Aa1] > [P.sub.Aa2][??] saamsmeltbaar is, sal die pad-kwad [??][P.sub.Aa1], [P.sub.Aa2] , [P.sub.Ab], [P.sub.Ac][??] kan gekondenseer word na scenario's vir [??] [P.sub.Aa], [P.sub.Ab], [P.sub .Ac][??].

Nou bied ons 'n pad-telformule vir [[PHI].sub.aabc] waar a nie 'n voorouer van b en c is nie, soos volg:

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII], (A.3)

waar A: 'n quad-algemene voorouer van a, b, c en d.

Wanneer [??][P.sub.Aa1], [P.sub.Aa2][??] nie saamsmeltbaar is nie,

Tipe 1: nulwortel 2-oorvleueling en nulwortel 3-oorvleueling pad

Tipe 2: een wortel 2-oorvleuel pad [P.sub.As] eindig by a

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII]. (A.4)

Wanneer [??][P.sub.Aa1], [P.sub.Aa2][??] saamsmeltbaar is,

Tipe 4: [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] het nulwortel 2-oorvleuelingpad

Tipe 5: [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] het een wortel 2-oorvleuel pad PA's wat eindig by s

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII]. (A.5)

Let daarop dat as a 'n voorouer is van óf b óf c, of albei van hulle, dan is die padtelformule van [[PHI].sub.abcd] van toepassing om [[PHI].sub.a1a2bc] te bereken.

A3. Padtelformule vir [[PHI].sub.aaab]. 'n Spesiale geval van [WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII] word bekendgestel wanneer [WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII nie] saamsmeltbaar is.Met die bestaan ​​van 'n saamsmeltbare pad-trippel, kan [WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII] gekondenseer word na [??][P.sub.Aa], [P.sub.Ab] [??].

Definisie A3 (Saamvoegbare Pad-Triple). Gegewe drie paaie [P.sub.Aa1], [P.sub.Aa2] en [P.sub.Aa3], is hulle saamsmeltbaar as en slegs as hulle heeltemal identies is.

Lemma A.4. Gegewe 'n pad-kwad [WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII] moet daar ten minste een saamsmeltbare pad-paar onder [WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII] wees.

Bewys. Vir 'n individu a met twee ouers f en m, word die vaderlike alleel van die individu a oorgedra vanaf f en die moederlike alleel vanaf m. Op alleelvlak word slegs twee afkomspaaie wat vanaf 'n voorouer begin, toegelaat. Vir 'n pad-kwad [WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII] moet daar ten minste een saamsmeltbare pad-paar onder [WISKUNDIGE UITDRUKKING NIE HERPRODUISEERBAAR IN ASCII] wees.

Vir eenvoud behandel ons [??][P.sub.Aa1], [P.sub.Aa2][??] as 'n verstek saamsmeltbare pad-paar.

Nou bied ons die padtelformule vir [[PHI].sub.aaab] waar a nie 'n voorouer van b is nie soos volg:

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII], (A.6)

waar A: 'n gemeenskaplike voorouer van a en b.

Wanneer daar net een saamsmeltbare padpaar is (kom ons beskou [??][P.sub.Aa1], [P.sub.Aa2][??] as die saamsmeltbare padpaar),

Tipe 1: [??][P.sub.Aa1], [P.sub.Aa3], [P.sub.Ab][??] het nulwortel 2-oorvleuelingpad,

Tipe 2: [??][P.sub.Aa1], [P.sub.Aa3], [P.sub.Ab][??] het een wortel 2-oorvleuelpad PA's wat eindig by s.

Wanneer ([P.sub.Aa1], [P.sub.Aa2], [P.sub.Aa3][??] saamsmeltbaar is,

Tipe 3: [??][P.sub.Aa], [P.sub.Ab][??] is nie-oorvleuelend

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII]. (A.7)

Let daarop dat as a 'n voorouer van b is, behandel ons [[PHI].sub.aaab] = [[PHI].sub.a1a2a3b]. Dan pas ons die pad-telformule vir [[PHI].sub.abcd] toe om [[PHI].sub.a1a2a3b] te bereken.

B. Bewys vir padtelformules van drie individue

Ons demonstreer eers dat, vir een drievoudige gemeenskaplike voorouer A, die padtelberekening van [[PHI].sub.abc] gelykstaande is aan die berekening deur rekursiewe formules te gebruik. Dan bewys ons die korrektheid van die padtelling-berekening vir veelvuldige trippel-gemeenskaplike voorouers.

B.1. Een drievoudige gemeenskaplike voorouer. Met inagneming van die verskillende tipes paddrielinge vanaf 'n drievoudige gemeenskaplike voorouer A in 'n stamboomgrafiek G wat bydra tot [[PHI].sub.abc] en [[PHI].sub.aab], kan G 5 verskillende gevalle hê:

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII] (B.1)

Gebaseer op die 5 gevalle van Geval 2.1 tot Geval 3.2, konstrueer ons eers 'n afhanklikheidsgrafiek wat in Figuur 17 getoon word, in ooreenstemming met die rekursiewe formules (3), (4) en (5) vir die algemene verwantskapskoëffisiënte vir drie individue.

Dan neem ons die volgende stappe om die korrektheid van die padtelformules (12) en (A.1) te bewys:

(i) vir [[PHI].sub.ab] word die korrektheid van die padtelformule (d.i. Wright se formule) bewys in [21]. Vir Geval 2.1 en Geval 2.2 word die korrektheid bewys gebaseer op die korrektheid van Gevalle 3.1 en 3.2

(ii) vir Geval 2.3 het dit geen siklus nie maar hang slegs af van [[PHI].sub.ab]. Ons bewys dus die korrektheid van Geval 2.3 deur die saak na [[PHI].sub.ab] te transformeer

(iii) vir Gevalle 3.1 en 3.2, word die korrektheid bewys deur induksie op die aantal rande, n, in die stamboomgrafiek G.

B.1.1. Korrektheid Bewys vir Geval 3.1

Geval 3.1. Vir [[PHI].sub.abc] het G nie enige pad drievoudige [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] met wortel oorvleuel.

Bewys (Basis). Daar is twee basiese scenario's: (i) een individu is 'n ouer van 'n ander (ii) geen individu is 'n ouer van 'n ander nie, onder a, b en c.

Gebruik die rekursiewe formule (3) om 0abc te bereken, vir Figuur 18(a), [[PHI].sub.abc] = (1/2) [[PHI].sub.abc] = [(1/2). sup.2] [[PHI].sub.abc] vir Figuur 18(b), 0abc = (1/2) [[PHI].sub.abc] = [(1/2).sup.2] [[ PHI].sub.abc] = [(1/2).sup.3] [[PHI].sub.AAA].

Deur die pad-telformule (12) te gebruik, as 'n pad-trippel [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] geen worteloorvleueling het nie (dws Tipe 1), dan die bydrae van [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] tot [[PHI].sub. abc] kan soos volg bereken word: [WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII].

Vir Figuur 18(a), is c die enigste driedubbele gemeenskaplike voorouer en ons verkry [WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII].

Induksiestap. Laat n die aantal rande in G aandui. Aanvaar waar vir n < k, waar k > 2. Dan wys ons dit is waar vir n = k + 1.

Vir Figure 19(a) en 19(b), onder a, b en c, laat a die individu wees wat die langste pad het vanaf hul drievoudige gemeenskaplike voorouer in die stamboomgrafiek G met (k+1) rande. As ons die nodus a verwyder en die rand f [regspyl] a van G sny, dan het die nuwe grafiek [G.sup.*] k rande. Wat die berekening van [[PHI].sub.fbc] betref, voldoen [G.sup.*] aan die voorwaarde vir induksiehipotese.

Vir Figuur 19(a),[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII]. Gebaseer op die rekursiewe formule (3), [[PHI].sub.abc] = (1/2) [[PHI].sub.fbc] + [[PHI].sub.mbc]) waar f en m ouers is van 'n. In G het a slegs een ouer f dus dui dit aan [[PHI].sub.mbc] = 0. Dan kan ons die padtelformule inprop vir [[PHI].sub.fbc] om te verkry

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII]. (B.2)

B.1.2. Korrektheid Bewys vir Geval 3.2

Geval 3.2. Vir [[PHI].sub.abc] het G paddrievoudige ([P.sub.Aa], P^, [P.sub.Ac]) met worteloorvleueling.

Bewys (Basis). Daar is drie basiese scenario's: (i) daar is twee individue wat ouers van 'n ander is (ii) daar is net een individu wat ouer is van 'n ander (iii) daar is geen individu wat 'n ouer van 'n ander is nie, onder a, b, en c.

Gebruik die rekursiewe formule (3) om [[PHI].sub.abc] te bereken: in Figuur 20, vir Figuur 20(a), [[PHI].sub.abc] = (1/2) [[PHI]. sub.bbc] = [(1/2).sup.2] [[PHI].sub.abc] = [(1/2).sup.3] [[PHI].sub.cc] vir Figuur 20( b), [[PHI].sub.abc] = (1/2) [[PHI].sub.bbc] = [(1/2).sup.2]Ofcc = [(1/2).sup. 4] [[PHI].sub.AA] vir Figuur 20(c), [[PHI].sub.abc] = [(1/2).sup.2] [[PHI].sub.ssc] = ( 1/2)3 [[PHI].sub.sc] = [(1/2).sup.5] [[PHI].sub.AA].

Deur die pad-telformule (12) te gebruik, as 'n pad-trippel [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] worteloorvleueling het ( dws Tipe 2), dan die bydrae van [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] tot [[PHI].sub.fbc ] kan soos volg bereken word: [WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII] en s is die laaste individu van die worteloorvleuelingspad [P.sub.As].

Vir Figuur 20(a), is c die enigste driedubbele gemeenskaplike voorouer en ons verkry [WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII]. Net so kry ons vir Figure 20(b) en 20(c) [[PHI].sub.abc] = [(1/2).sup.4] [[PHI].sub.aa] en [[PHI] ].sub.abc] = [(1/2).su.5] [[PHI].sub.AA], onderskeidelik.

Induksiestap. Laat n die aantal rande in G aandui. Aanvaar waar vir n [minder as of gelyk aan] k, waar k [groter as of gelyk aan] 2. Toon dat dit waar is vir = fc + 1.

Vir Figure 21(a), 21(b) en 21(c), onder a, fc en c, laat a die individu wees wat die langste pad het en laat p 'n ouer van a wees. Dan sny ons die rand p [regspyl] a van G af en kry 'n nuwe grafiek [G.sup.*] wat aan die voorwaarde van induksiehipotese voldoen. Vir Figuur 21(a), gebruik ons ​​die pad-telformule vir [WISKUNDIGE UITDRUKKING NIE HERPRODUSEBAAR IN ASCII].

In G is f die enigste ouer van a, volgens die rekursiewe formule (3), het ons [[PHI].sub.abc] = (1/2) [[PHI].sub.afc]. Dan kan ons die [[PHI].sub.fbc] inprop en verkry

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII]. (B.3)

Vir Figure 21(b) en 21(c), neem ons dieselfde stappe as wat ons [[PHI].sub.abc] vir Figuur 21(a) bereken.

Samevattend is dit waar vir n = fc + 1.

B.1.3. Korrektheid Bewys vir Geval 2.3

Geval 2.3. Vir [[PHI].sub.aab] het die pad-trippels in die stamboomgrafiek G saamsmeltbare pad-paar.

Bewys. As die verband tussen a en fc in ag geneem word, het G twee scenario's: (i) fc is nie 'n voorouer van 'n nie (ii) fc is 'n voorouer van a. Deur die pad-telformule (A.1) te gebruik, as 'n pad-trippel ([P.sub.Aa1], [P.sub.Aa2], [P.sub.Ab]) 6 Tipe 3, wat beteken dat dit 'n saamsmeltbare padpaar het, dan is die bydrae van [??][P.sub.Aa1], [P.sub.A2], [P.sub.Ab][??] tot [[PHI].sub. aab] kan soos volg bereken word: [WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII].

Deur die rekursiewe formule (4) te gebruik, verkry ons [[PHI].sub.aab] = (1/2)([[PHI].sub.ab] + [[PHI].sub.fmb]).

Vir Figuur 22(a), is A 'n gemeenskaplike voorouer van a en fc. [??] a het net een ouer f

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII]. (B.4)

Vir [[PHI].sub.ab] gebruik ons ​​Wright se formule en verkry [WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII] OAA waar P alle nie-oorvleuelende padpare aandui [??][P.sub.Aa], [P.sub] .Ab][??].

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII].

Vir Figuur 22(b), kan ons ook die berekening van [[PHI].sub.aab] na [[PHI].sub.ab] transformeer.

Opsommend wys dit dat die padtelformule (A.1) waar is vir Geval 2.3.

B.1.4. Korrektheidsbewys vir gevalle 2.1 en 2.2. Vir [[PHI].sub.aab], wanneer daar geen pad-trippel met saamsmeltbare pad-paar is nie, (dws die pad-trippel behoort aan óf Geval 2.1 óf Geval 2.3), [[PHI].sub.aab] kan getransformeer word na [WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII], wat gelykstaande is aan die berekening van [[PHI].sub.abc] vir Gevalle 3.1 en 3.2. Die korrektheid van ons padtelformule vir Gevalle 3.1 en 3.2 is bewys. Dus verkry ons die korrektheid vir [[PHI].sub.aab] wanneer die pad-trippel aan óf Geval 2.1 óf Geval 2.2 behoort.

B.2. Veelvuldige drievoudige gemeenskaplike voorouers. Nou verskaf ons die korrektheidbewys vir veelvuldige drievoudige gemeenskaplike voorouers met betrekking tot die padtelformules (12) en (A.1).

Lemma A. Gegewe 'n stamboomgrafiek G en drie individue a, b, c met ten minste een trip-gemeenskaplike voorouer, [[PHI].sub.abc] word korrek bereken deur die padtelformules (12) en (A.1) te gebruik. ).

Bewys. Bewys deur induksie van die aantal drievoudige gemeenskaplike voorouers

Basis. G het net een drievoudige gemeenskaplike voorouer van a, b en c.

Die korrektheid van (12) en (A.1) vir G met slegs een drievoudige gemeenskaplike voorouer van a, b en c word in die vorige afdeling bewys.

Induksiehipotese. Aanvaar dat as G k of minder drievoudige gemeenskaplike voorouers van a, b en c het, is 12) en (A.1) korrek vir G.

Induksiestap. Nou wys ons dat dit waar is vir G met k + 1 drievoudige gemeenskaplike voorouers van a, b en c.

Laat Tr_C(a, b, c, G) alle drievoudige gemeenskaplike voorouers van a, b en c in G aandui, waar Tri_C(a, b, c, G) = <[A.sub.i] | 1 [minder as of gelyk aan] i [minder as of gelyk aan] k + 1>. Laat A1 die mees top drievoudige gemeenskaplike voorouer wees sodat daar geen individu onder die oorblywende voorouers is nie <[A.sub.i] | 2 [minder as of gelyk aan] i [minder as of gelyk aan] k + 1>wat 'n voorouer van [A.sub.1] is. Laat [minder as of gelyk aan] ([A.sub.1]) die bydrae van A1 tot [[PHI].sub.abc] aandui.

Omdat A1 die mees top trippel-algemene voorouer is, is daar [minder as of gelyk aan] geen pad-trippel van <[A.sub.i] | 2 [minder as of gelyk aan] i [minder as of gelyk aan] k + 1>na a, b en c wat deur A1 gaan. Dan kan ons [A.sub.1] van G verwyder en alle uitgaande rande van [A.sub.1] uitvee en 'n nuwe grafiek G' verkry wat k drievoudige gemeenskaplike voorouers van a, b en c het . Dit beteken Tri_C(a, b, c, G') = <[A.sub.i] | 2 [minder as of gelyk aan] i [minder as of gelyk aan] k + 1>.

Vir die nuwe grafiek G' kan ons ons induksiehipotese toepas en [[PHI].sub.abc] (G') verkry.

Vir die mees top drievoudige gemeenskaplike voorouer A1, is daar twee verskillende gevalle met inagneming van sy verhouding met die ander driedubbele gemeenskaplike voorouers:

(1) daar is geen individu onder <[A.sub.i] | 2 [minder as of gelyk aan] i [minder as of gelyk aan] k + 1>wat 'n afstammeling is van [A.sub.1]

(2) daar is ten minste een individu onder <[A.sub.i] | 2 [minder as of gelyk aan] i [minder as of gelyk aan] k + 1>wat 'n afstammeling van [A.sub.1] is.

Vir (1), aangesien geen individu onder <[A.sub.i] | 2 [minder as of gelyk aan] i [minder as of gelyk aan] k + 1> is 'n afstammeling van A1, die stel pad-drievoudige van [A.sub.1] na a, b en c is onafhanklik van die stel pad-trippels vanaf <[A.sub.i] | 2 [minder as of gelyk aan] i [minder as of gelyk aan] k + 1>tot a, b, en c. Dit beteken ook dat die bydrae van

[A.sub.1] tot [[PHI].sub.abc] is onafhanklik van die bydrae van die ander trippel-gemeenskaplike voorouers.

Om alle bydraes op te som, kan ons [[PHI].sub.abc] (G) = [[PHI].sub.abc] (G') + S([A.sub.1]) verkry.

Vir (2), laat [A.sub.j] een afstammeling van [A.sub.1] wees. Nou kan beide [A.sub.1] en [A.sub.j] a, b en c bereik.

As [t.sub.a], [t.sub.b] en [t.sub.c] almal deur [t.sub.j] gaan, is die pad-trippel [pt.sub.i] nie 'n kwalifiserende pad-trippel vir [[PHI].sub.abc]. Wanneer ons die bydrae van A1 tot [[PHI].sub.abc bereken, sluit ons alle sulke pad-trippels uit waar [t.sub.a], [t.sub.b] en [t.sub.c] almal gaan deur 'n laer trippel-gemeenskaplike voorouer. Met ander woorde, 'n kwalifiserende pad-trippel van [A.sub.1] met betrekking tot [[PHI].sub.abc] kan nie drie paaie hê wat almal deur 'n laer trippel-gemeenskaplike voorouer gaan nie. Daarom weet ons dat die bydrae van A1 tot [[PHI].sub.abc] onafhanklik is van die bydrae van die ander drievoudige gemeenskaplike voorouers. Om alle bydraes op te som, kry ons [[PHI].sub.abc](G) = [[PHI].sub.abc](G') + S(A 1).

C. Bewys vir vier individue en twee pare individue

Hier gee ons 'n bewysskets vir die korrektheid van padtelformules vir vier individue. Eerstens, vir vier individue in 'n stamboomgrafiek G, bied ons alle verskillende gevalle aan op grond waarvan ons 'n afhanklikheidsgrafiek konstrueer. Die korrektheid van die padtelformules vir twee-paar individue kan op soortgelyke wyse bewys word.

C.1. Bewys vir vier individue. Oorweeg die bestaan ​​van verskillende tipes pad-kwads met betrekking tot [[PHI].sub.abcd], [[PHI].sub.aabc], en [[PHI].sub.aaab] daar is 15 gevalle vir 'n stamboomgrafiek G :

[WISKUNDIGE UITDRUKKING NIE HERPRODUSEBAAR IN ASCII]

[WISKUNDIGE UITDRUKKING NIE REPRODUSEBAAR IN ASCII] (C.1)

Dan konstrueer ons 'n afhanklikheidsgrafiek wat in Figuur 23 getoon word vir alle gevalle vir vier individue.

Volgens die afhanklikheidsgrafiek in Figuur 23 is die tussenstappe insluitend Gevalle 3.4 en 3.5 reeds bewys vir die berekening van [[PHI].sub.abc]. Die korrektheid van die transformasie van Geval 4.2 na Geval 3.4 kan bewys word op grond van die rekursiewe formule vir [[PHI].sub.abcd] en [[PHI].sub.aabc]. Net so kan ons die transformasie van Geval 4.3.1 na Geval 3.5 verkry.

C.2. Bewys vir twee pare individue. Oorweeg die bestaan ​​van verskillende tipes 2-paar-pad-paar met betrekking tot [[PHI].sub.ab,cd] daar is 9 gevalle wat soos volg gelys word.

Geval 4.1. G het [??]([P.sub.Aa], [P.sub.Ab], ([P.sub.Ac], [P.sub.Aa])[??] met nul wortel homo-oorvleueling en nul wortel heter-oorvleuel.

Geval 4.2. G het [??]([P.sub.Aa], [P.sub.Ab]), ([P.sub.Ac], [P.sub.Ad])[??] met nul wortel homo-oorvleueling en een wortel heter-oorvleueling.

Geval 4.3.1. G het [??]([P.sub.Aa], [P.sub.Ab]), ([P.sub.Ac], [P.sub.Ad])[??] met nul wortel homo- oorvleuel en tweewortel heter-oorvleuel.

Geval 4.3.2. G het [??]([P.sub.Aa], [P.sub.Ab]), ([P.sub.Ac], [P.sub.Aa])[??] met een wortel homo- oorvleuel en tweewortel heter-oorvleuel.

Geval 4.4. G het [??]([P.sub.Aa], [P.sub.Ab]), ([P.sub.Ac], [P.sub.Ad])[??] met een wortel-homo-oorvleueling en nulwortel heter-oorvleueling.

Geval 4.5. G het [??]([P.sub.Aa], [P.sub.Ab]), ([P.sub.Ac], [P.sub.Ad])[??] met tweewortel-homo-oorvleueling en nulwortel heter-oorvleueling.

Geval 4.6. G het pad-trippels [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] met nulworteloorvleueling.

Geval 4.7. G het pad-trippels [??][P.sub.Aa], [P.sub.Ab], [P.sub.Ac][??] met een worteloorvleueling.

Geval 4.8. G het padpare [??][P.sub.Tc], [P.sub.Td][??] met nulworteloorvleueling.

Dan konstrueer ons 'n afhanklikheidsgrafiek vir die gevalle wat verband hou met [[PHI].sub.ab,cd] in Figuur 24.

Volgens die afhanklikheidsgrafiek in Figuur 24 is gevalle 4.6, 4.7 en 4.8 die tussenstappe wat reeds bewys is vir die berekening van [[PHI].sub.abc]. Die korrektheid van die transformasie van Geval 4.2 na Geval 4.6 kan bewys word op grond van die rekursiewe formule vir [[PHI].sub.ab,cd] en [[PHI].sub.ab,cd]. Net so kan ons die transformasie van Gevalle 4.3.1 en 4.3.2 na Geval 4.7 sowel as van Geval 4.4 na Geval 4.8 dienooreenkomstig verkry.

Die outeurs verklaar dat daar geen belangebotsing is met betrekking tot die publikasie van hierdie artikel nie.

Die skrywers bedank professor Robert C. Elston, Case School of Medicine, vir die bekendstelling van die identiteitskoëffisiënte aan hulle en verwys hulle na die verwante literatuur [7, 10, 17]. Hierdie werk word gedeeltelik ondersteun deur die National Science Foundation Grants DBI0743705, DBI0849956, en CRI0551603 en deur die National Institute of Health Grant GM088823.

[1] Chirurg-generaal se nuwe Gesinsgesondheidsgeskiedenishulpmiddel is vrygestel, gereed vir "21st Century Medicine", http://compmed.com/category/people-helping-people/page/7/.

[2] M. Falchi, P. Forabosco, E. Mocci et al., "'n Genoomwye soektog met behulp van 'n oorspronklike paarsgewyse steekproefbenadering vir groot genealogieë identifiseer 'n nuwe lokus vir totale en lae-digtheid lipoproteïen cholesterol in twee geneties gedifferensieerde isolate van Sardinië ," Die American Journal of Human Genetics, vol. 75, nr. 6, pp. 1015-1031, 2004.

[3] M. Ciullo, C. Bellenguez, V. Colonna et al., "Nuwe vatbaarheid lokus vir hipertensie op chromosoom 8q deur doeltreffende stamboom-breking in 'n Italiaanse isolaat," Human Molecular Genetics, vol. 15, nr. 10, pp. 1735-1743, 2006.

[4] Glossary of Genetic Terms, National Human Genome Research Institute, http://www.genome.gov/glossary/?id=148.

[5] C. W. Cotterman, A calculus for statistico-genetics [Ph.D. tesis], Columbus, Ohio, VSA, Ohio State University, 1940, Herdruk in P. Ballonoff, Red., Genetics and Social Structure, Dowden, Hutchinson & Ross, Stroudsburg, Pa, VSA, 1974.

[6] G. Malecot, Les mathematique de l'heredite, Masson, Parys, Frankryk, 1948, vertaalde uitgawe: The Mathematics of Heredity, Freeman, San Francisco, Kalifornië, VSA, 1969.

[7] M.Gillois, "La relation d'identite en genetique," Annales de l'Institut Henri Poincare B, vol. 2, pp. 1-94, 1964.

[8] D. L. Harris, "Genotipiese kovariansies tussen ingeteelde familielede," Genetics, vol. 50, pp. 1319-1348, 1964.

[9] A. Jacquard, "Logique du calcul des coefficients d'identite entre deux individuals," Population, vol. 21, pp. 751-776, 1966.

[10] G. Karigl, "'n Rekursiewe algoritme vir die berekening van identiteitskoëffisiënte," Annals of Human Genetics, vol. 45, nee. 3, pp. 299-305, 1981.

[11] B. Elliott, S. F. Akgul, S. Mayes en Z. M. Ozsoyoglu, "Doeltreffende evaluasie van inteling navrae oor stamboomdata," in Proceedings of the 19th International Conference on Scientific and Statistical Database Management (SSDBM '07), Julie 2007.

[12] B. Elliott, E. Cheng, S. Mayes, en Z. M. Ozsoyoglu, "Doeltreffende berekening van inteling op groot stambome databasisse," Information Systems, vol. 34, nr. 6, pp. 469-492, 2009.

[13] L. Yang, E. Cheng en ZM (Ozsoyoglu, "Gebruik com[P.sub.Ac]t-enkoderings vir padgebaseerde berekeninge op stamboomgrafieke," in Proceedings of the ACM Conference on Bioinformatics, Computational Biology and Biomedisyne (ACM-BCB '11), pp. 235-244, Augustus 2011.

[14] E. Cheng, B. Elliott en ZM Ozsoyoglu, "Scalable computation of verwantskap- en identiteitskoëffisiënte op groot stambome," in Proceedings of the 7th Annual International Conference on Computational Systems Bioinformatics (CSB '08), pp. 27- 36, 2008.

[15] E. Cheng, B. Elliott, en ZM (Ozsoyoglu, "Doeltreffende berekening van verwantskap en identiteitskoëffisiënte op groot stambome," Journal of Bioinformatics and Computational Biology (JBCB), vol. 7, no. 3, pp. 429 -453, 2009.

[16] S. Wright, "Coefficients of inteling and relationship," The American Naturalist, vol. 56, nr. 645, 1922.

[17] R. Nadot en G. Vaysseix, "Verwantskap en identiteit algoritme van koëffisiënte van identiteit," Biometrics, vol. 29, nr. 2, pp. 347-359, 1973.

[18] E. Cheng, Scalable path-based computations on pedigree data [Ph.D. tesis], Case Western Reserve Universiteit, Cleveland, Ohio, VSA, 2012.

[19] V. Ollikainen, Simulasietegnieke vir Siektegenelokalisering in geïsoleerde bevolkings [Ph.D. proefskrif], Universiteit van Helsinki, Helsinki, Finland, 2002.

[20] H. T. T. Toivonen, P. Onkamo, K. Vasko et al., "Data-ontginning toegepas op koppeling disequilibrium kartering," The American Journal of Human Genetics, vol. 67, nr. 1, pp. 133-145, 2000.

[21] W. Boucher, "Berekening van die intelingskoëffisiënt," Journal of Mathematical Biology, vol. 26, nr. 1, pp. 57-64, 1988.

En Cheng (1) en Z. Meral Ozsoyoglu (2)

(1) Departement Rekenaarwetenskap, Die Universiteit van Akron, Akron, OH 44325, VSA

(2) Departement Elektriese Ingenieurswese en Rekenaarwetenskap, Case Western Reserve Universiteit, Euclidlaan 10900, Cleveland, OH 44106, VSA


Waarskynlikhede in die berekening van die verwantskapskoëffisiënt - Biologie

Aangesien daar 'n eindige aantal allele by die meeste genetiese lokusse is, kan individue dieselfde genotipe by 'n spesifieke lokus vertoon, maar dra nietemin afsonderlike chromosome. Inligting oor alleelfrekwensies en naburige merkers kan gebruik word om die waarskynlikheid te skat dat enige twee individue eintlik dieselfde chromosoom van stigters in die stamboom geërf het.

MERLIN kan die aantal allele wat identies gedeel word volgens afkoms onder familielede in 'n stamboom skat, en hierdie inligting opsom óf as waarskynlikhede dat 'n gegewe paar 0, 1 of 2 allele IBD sal deel óf as die verwantskapskoëffisiënt tussen elke paar by 'n spesifieke lokus.

Sommige programme vereis IBD skattings as insette vir hul ontleding. Byvoorbeeld, QTDT toets vir assosiasie deur alle fenotipes van verwante individue te gebruik en vereis IBD-matrikse om tussen koppeling en assosiasie te onderskei.

Vir hierdie voorbeeld sal ons 'n gesimuleerde datastel gebruik wat jy sal vind in die voorbeelde subgids van die MERLIN verspreiding of in die aflaai bladsy.

Die datastel sluit 50 gesinne in, elk met 4 broers en susters, gegentipeer vir 3 SNP-merkers en word ook in die QTDT-tutoriaal gebruik. Ons sal MERLIN gebruik om IBD vir hierdie datastel te skat in 'n formaat wat gereed is vir gebruik deur QTDT.

Jy behoort reeds vertroud te wees met invoerlêerformate. Die data bestaan ​​uit 'n stamboomlêer ( sibs.ped ), wat individuele verwantskappe, genotipes en fenotipes spesifiseer. Daarbenewens verskaf 'n kaartlêer ( sibs.map ) merkerliggings en 'n datalêer ( sibs.dat ) beskryf die datastel.

Soos gewoonlik is dit altyd 'n goeie idee om die inhoud van invoerlêers na te gaan deur pedstats uit te voer:

Om paarsgewyse IBD-matrikse te bereken, sal ons die --ibd-opdragreëlopsie gebruik. Aangesien MERLIN by verstek alle resultate met chromosomale posisies etiketteer, sal ons ook die --markerNames-opsie gebruik om te versoek dat uitvoer die merkername insluit wat deur QTDT vereis word. Dus, die opdrag:

Sal IBD-koëffisiënte vir alle relatiewe pare skat en 'n merlin.ibd-lêer produseer wat gereed is vir gebruik deur QTDT. Elke reël in merlin.ibd begin met 'n familie identifiseerder gevolg deur identifiseerders vir twee individue. Dit word gevolg deur merkername en waarskynlikhede vir die deel van 0, 1 en 2 allele IBD.

Algemeen gebruikte opsies wanneer IBD-koëffisiënte beraam word, sluit in --enkelpunt (wat elke merker onafhanklik oorweeg) en --stappe n (wat ontleding op n posisies tussen merkers versoek) of die --rooster k (wat ontleding elke k cM langs die chromosoom versoek) .


FST en verwantskap vir arbitrêre bevolkingstrukture I: Algemene definisies

FST is 'n fundamentele maatstaf van genetiese differensiasie en bevolkingstruktuur, tans gedefinieer vir onderverdeelde bevolkings. FST in die praktyk tipies veronderstel onafhanklike, nie-oorvleuelende subpopulasies, wat almal gelyktydig van hul laaste gemeenskaplike voorouerbevolking verdeel het sodat genetiese drywing in elke subpopulasie waarskynlik onafhanklik van die ander subpopulasies is. Ons stel 'n veralgemeende voor FST definisie vir arbitrêre bevolkingstrukture, waar individue op arbitrêre maniere verwant kan wees, wat arbitrêre waarskynlikheidsafhanklikheid tussen individue moontlik maak. Ons definisies is gebou op identiteit-deur-afkoms (IBD) waarskynlikhede wat individue deur inteling en verwantskapskoëffisiënte in verband bring. Ons veralgemeen FST as die gemiddelde intelingkoëffisiënt van die individue se plaaslike bevolkings relatief tot hul laaste gemeenskaplike voorouerbevolking. Ons wys dat die veralgemeende definisie ooreenstem met Wright se oorspronklike en die onafhanklike subpopulasie definisies as spesiale gevalle. Ons definieer 'n nuwe herkomsmodel gebaseer op "individu-spesifieke alleelfrekwensies" en bewys dat sy parameters ooreenstem met waarskynlike verwantskapskoëffisiënte. Laastens brei ons die Pritchard-Stephens-Donnelly-mengselmodel uit in die konteks van ons herkomsmodel en bereken die FST. Om hierdie werk te motiveer, sluit ons 'n opsomming van ontledings in wat ons in opvolgvraestelle uitgevoer het, waar ons nuwe benadering toegepas is op simulasies en globale menslike data, wat die kompleksiteit van menslike bevolkingstruktuur aantoon, ons sukses in die skatting van verwantskap en FST, en die tekortkominge van bestaande benaderings. Die probabilistiese raamwerk wat ons hier instel, verskaf 'n teoretiese grondslag wat strek FST in terme van inteling en verwantskapskoëffisiënte tot arbitrêre bevolkingstrukture, wat die weg baan vir nuwe beramers en nuwe ontledings.

Let wel: Hierdie artikel is Deel I van tweedelige manuskripte. Ons verwys daarna in die teks as onderskeidelik Deel I en Deel II.


Waarskynlikheidsreël Een

Ons eerste reël herinner ons eenvoudig aan die basiese eienskap van waarskynlikheid wat ons reeds geleer het.

Die waarskynlikheid van 'n gebeurtenis, wat ons inlig oor die waarskynlikheid dat dit sal plaasvind, kan enige plek wissel van 0 (wat aandui dat die gebeurtenis nooit sal plaasvind nie) tot 1 (wat aandui dat die gebeurtenis seker is).

Waarskynlikheidsreël een:

LET WEL: Een praktiese gebruik van hierdie reël is dat dit gebruik kan word om enige waarskynlikheidsberekening wat uitkom as meer as 1 (of minder as 0) as verkeerd te identifiseer.

Voordat jy verder gaan na die ander reëls, laat’s kyk eers na 'n voorbeeld wat 'n konteks sal verskaf vir die illustrasie van die volgende verskeie reëls.


Berekening van intelingskoëffisiënte uit data

As die waargenome heterosigositeit in 'n populasie (H_O) is, en ons aanvaar dat die veralgemeende Hardy–Weinberg-proporsies geld, kan ons (H_O) gelyk stel aan (f_<12>) , en Vgl. vir (F) om 'n skatting van die intelingskoëffisiënt as te verkry

Soos voorheen is (p) die frekwensie van alleel (A_<1>) in die populasie. Dit kan herskryf word in terme van die waargenome heterosigositeit ( (H_O) ) en die heterosigositeit wat verwag word in die afwesigheid van inteling, (H_E=2pq) , as [hat = frac = 1 - frac. etiket] Daarom, (hat) kwantifiseer die afwyking as gevolg van inteling van die waargenome heterosigositeit van die een wat verwag word onder ewekansige paring, relatief tot laasgenoemde. As ons veelvuldige lokusse het, kan ons (H_O) en (H_E) vervang deur hulle middele oor loci, (ar_O) en (ar_E) , onderskeidelik. Let daarop dat ons in beginsel ook eers (F) vir elke individuele lokus kan bereken, en dan die gemiddelde oor lokusse kan neem. Hierdie prosedure is egter meer geneig om 'n vooroordeel in te voer as steekproefgroottes oor loci verskil, wat nie onwaarskynlik is wanneer ons met werklike data te doen het nie.

Gestel die volgende genotipefrekwensies is waargeneem vir by 'n esterase lokus in 'n populasie van Drosophila (A dui die ``vinnige" alleel aan en B dui die ``stadige' alleel aan):

Wat is die skatting van die intelingskoëffisiënt by die esterase lokus?


Waarskynlikhede in die berekening van die verwantskapskoëffisiënt - Biologie

As voldoende data beskikbaar is, is een manier om die belangrikheid van 'n voorouer te bepaal om sy persentasie bydrae tot die huidige honde te bereken. Die % bydrae (aka persentasie bloed) word bepaal deur die manier waarop gene van die ouers na die nageslag oorgedra word. 'n Individu erf een stel chromosome, en die gene wat hulle dra, van sy of haar vader en 'n tweede, homoloë (ekwivalente) stel van die moeder. Elke ouer maak dus 'n 50% bydrae. Aangesien die ouers in enige generasie altyd 50% van hul gene tot hul nageslag bydra, lyk dit redelik om te verwag dat 25% van elke grootouer, 12,5% van elke grootouer, ensovoorts sal kom. As ons egter eers verby die ouers is, het ons te doen met waarskynlikhede, nie sekerhede nie. Dit is nie soos om verf te meng nie! Wanneer pa vir jou een stel van sy chromosome gee, sal hulle 'n seleksie insluit wat van albei sy ouers geërf is, maar daar is geen waarborg dat die keuse presies gelyk sal wees nie. Daar is selfs 'n klein kans (baie klein) dat hy dié van slegs een van sy ouers sal deurgee.

Teen die tyd dat ons 10 generasies terugkom, sou die bydrae van elk van die 1024 voorouers in teorie effens minder as 0,1% beloop. In die stamboom van die gemiddelde rasegte hond is daar egter selde meer as 100-200 verskillende name en sommige verskyn 50 keer of meer. Dit is die beduidende voorouers wat die belangrikste genetiese bydraes lewer.

As jy 'n stamboom het, kan jy % bydrae van enige herhalings bereken bloot deur die aantal kere wat elke voorouer in enige generasie verskyn te vermenigvuldig met die toepaslike persentasie vir daardie generasie en dan al die berekende persentasie bydraes van elke generasie bymekaar te tel. Die tabel hieronder gelys toon die persentasie bloed wat van elke voorouer geërf is op die gegewe generasievlakke. Generasie "1" is die ouers.

Genetiese bydrae van voorouers
Generasie 1 2 3 4 5 6 7 8 9 10
% Bydrae 50.0 25.0 12.5 6.25 3.125 1.563 0.781 0.391 0.195 0.098

Jy moet 'n getal tussen 0 en 1 kry vermenigvuldig met 100% om die % bydrae te kry.

Databasisse bestaan ​​vir baie rasse wat die data sal bevat wat jou in staat stel om 'n stamboom uit te brei na 10 generasies of meer. Handmatige berekening, hoewel vervelig, is steeds moontlik, maar skaars gerieflik. Verskeie stamboomprogramme (bv. CompuPed) sal vinnig % bydrae vir geselekteerde voorouers of alle voorouers vir 'n bepaalde aantal generasies bereken, wat jou inligting verskaf oor watter honde die invloedrykste was.

Intelingskoëffisiënte

Terwyl die meeste telers erken dat 'n paring tussen halfbroers of neefs inteling verteenwoordig, het die meerderheid waarskynlik geen idee wat die nouste verwantskap is nie. Dit word nie aangehelp deur die nie-standaard definisie van inteling in sommige boeke (bv. Onstott se "Breeding Better Dogs").

Die standaarddefinisie van inteling is dat dit enige skema is wat daartoe lei dat die vader en die moeder gemeenskaplike voorouers het. Baie telers gebruik die term "inbreeding" vir naasbestaandes en "lynteling" vir meer ver verwante individue, maar daar is geen fundamentele verskil nie.

Die parameter wat gebruik word om hierdie gemeenskaplike erfenis uit te druk, word die genoem intelingskoëffisiënt en is die eerste keer voorgestel deur Sewell Wright in 1922. Aangewys as F deur Wright (maar meer algemeen IC of COI deur telers), kan dit teoreties wissel van 0 tot 100%, en dui die waarskynlikheid aan dat die twee allele vir enige geen is identies deur afkoms.

Die primêre gevolg van inteling is om homosigositeit te verhoog. Die IC is egter nie 'n direkte maatstaf van homosigositeit nie, want die twee allele wat van verskillende voorouers oorgedra is, kan funksioneel dieselfde wees. Verder sal 'n gedeelte van al die gene die homosigotiese wees omdat daar net een alleel is. Die IC dien as 'n aanduiding van watter proporsie van die res moontlik homosigoties gemaak is deur inteling.

Die intelingskoëffisiënt is 'n funksie van die aantal en ligging van die gemeenskaplike voorouers in 'n stamboom. dit is nie 'n funksie, behalwe indirek, van die inteling van die ouers. Dus kan 'n mens twee hoogs ingeteelde individue paar wat min gemeenskaplike afkoms deel en 'n werpsel produseer met 'n baie lae IC. (Omdat die potensiële aantal voorouers elke generasie verdubbel, bereik jy uiteindelik 'n punt waar die aantal voorouers die aantal individue wat op daardie tydstip lewendig oorskry. Jy is dus verplig om 'n paar gemeenskaplike voorouers te vind as jy ver genoeg teruggaan.) Omgekeerd is dit moontlik om twee naverwante honde te paar, wat albei lae IC's het, en die IC aansienlik verhoog.

Die mees gebruikte benadering vir die berekening van intelingskoëffisiënte is Wright se "paths" metode (sien nota), die beste geïllustreer deur 'n eenvoudige voorbeeld. Gestel ons paar halfbroers en susters, die gemeenskaplike voorouer, Anson, is die vader. Don is die seun van Anson en Bess Eva die dogter van Anson en Claire. Fred is een van hul nageslag.

Om dit te vereenvoudig, wys ons nie die voorouers wat nie gedeel word nie:

Nou kyk ons ​​na 'n geen waarvoor Anson twee verskillende allele dra, a1 en a2. Daar is 'n 50% waarskynlikheid dat die alleel wat Anson aan Don oorgedra is aan Fred oorgedra word. Daar is ook 'n 50% waarskynlikheid dat dieselfde alleel van Anson na Eva oorgedra sal word, en 'n 50% waarskynlikheid dat dit van Eva na Fred oorgedra word, as Eva dit gekry het. Wanneer ons te doen het met gebeure wat gebeurlik is (hierdie * en * wat moet gebeur), vermenigvuldig ons die waarskynlikhede - in hierdie geval 0,5 x 0,5 x 0,5 = 0,125 (12,5%). Hierdie finale getal is die waarskynlikheid dat Fred homosigoties sal wees vir een van die twee a1 of a2 as gevolg van die gemeenskaplike oupa.

Oor die algemeen is Wright se metode om die pad te bepaal van Fred na die gemeenskaplike voorouer, Anson, en weer terug aan die ander kant van die stamboom (Fred-Don-Anson-Eva-Fred), tel die aantal individue in die pad, uitgesluit Fred (daar is 3, Don-Anson-Eva) en dan bereken ½ n , waar n daardie getal is. Dus, in die huidige geval het ons (½) 3 of (½ x ½ x ½) = 1/8, of 12.5%. As dit die enigste gemeenskaplike voorouer was, sou die intelingskoëffisiënt vir Fred 12,5% wees.

Gestel nou die gemeenskaplike voorouer was een van die oupas van die ouers (d.w.s. 'n oupagrootjie van die rommel). Dit voeg 'n individu aan elke kant van die stamboom by, sodat ons 'n pad van die tipe Fred-X-Don-Anson-Eva-Y-Fred sal kry, en die inteling op Anson sal (1/2) 5 of 1 wees /32 (3,125%).

Soos baie ander genetiese berekeninge, is die IC gebaseer op waarskynlikhede, nie sekerhede nie. 'n Individu kan min of meer hoogs ingeteel wees as die getal wat bereken is.

As ons net 'n enkele gemeenskaplike voorouer gehad het om mee te doen, sou die lewe relatief eenvoudig wees. Daar is egter twee komplikasies om te hanteer. Die eerste is dat daar meer as een gemeenskaplike voorouer sal wees. Kom ons kyk na die geval van eerste neefs. In menslike bevolkings is so 'n paring in sommige samelewings verbied, maar in ander toegelaat. Ons het reeds die inteling vir 'n enkele gedeelde grootouer bereken. Eerste neefs het twee gedeelde grootouers, en ons voeg eenvoudig die intelingskoëffisiënt vir elkeen by om 6,25% te kry.

Die tweede komplikasie is dat die gemeenskaplike voorouer ingeteel kan wees. Indien wel, sal sy of haar intelingskoëffisiënt bereken moet word. Om dit te verantwoord moet ons die intelingskoëffisiënt wat vir Fred bereken is, vermenigvuldig met (1 + F A ), waar F A die intelingskoëffisiënt is wat vir Anson bereken is. Byvoorbeeld, as Anson die produk is van 'n paring van eerste neefs, sal die totale inteling vir Fred 0,125 x 1,0625 = 0,133 (13,3%) wees as daar geen ander gedeelde voorouers in die stamboom is nie.

Ongelukkig is daar in die gemiddelde stamboom 'n groot aantal gedeelde voorouers. Daarom kan die totale inteling vir 'n hond oor die algemeen nie met die hand bereken word nie en gepaste sagteware moet gebruik word (bv. CompuPed). Om inteling vir slegs die eerste paar generasies te bereken, is nie besonder nuttig nie. As daar meer as een of twee gemeenskaplike voorouers in vier of vyf generasies stamboom is, is die inteling waarskynlik reeds hoër as wat wenslik is. Ongelukkig is dit geen waarborg dat gemeenskaplike voorouers verder terug in oorvloed sal voorkom nie, en sommige stambome van hierdie tipe bereik steeds matige hoë intelingskoëffisiënte. Die aantal gedeelde voorouers kan ook nie as 'n betroubare gids gebruik word nie, aangesien die intelingskoëffisiënt baie sensitief is vir wanneer en waar hulle in 'n stamboom voorkom.

Is daar 'n vinnige manier om te bepaal hoe geneties soortgelyk twee honde is?

Gestel 'n teler het twee tewe (A en B) wat sy met verskillende mannetjies wil paar. Na deeglike navorsing het sy drie potensieel geskikte mannetjies (C, D en E) geïdentifiseer wat almal ewe goed lyk. Sy hoop om 'n reuntjie uit die een werpsel en 'n wyfie uit die ander te kry, en wil hulle uiteindelik vir mekaar teel. Die doel kan wees om die kombinasie te kies wat die potensiële inteling sal verminder.Alternatiewelik is sy dalk op soek na twee honde wat nie naasbestaandes is nie maar nog soortgelyke erfenis het.

Een benadering sou wees om hipotetiese werpsels vir alle kombinasies te produseer: AC, AD, AE, BC, BD en BE. Dan sal ons moet kyk na die moontlikhede vir die tweede generasie. Daar sal ses wees as ons nie gedeelde grootouers toelaat nie, en 36 as daar geen beperkings is nie. Hierdie potensiële werpsels kan dan vir inteling of die % bydrae van betekenisvolle voorouers geëvalueer word. Dit sal beslis die data verskaf, maar is onnodig vervelig.

Die Koëffisiënt van Verhouding

Die verwantskapskoëffisiënt (RC) bied 'n manier om die ooreenkoms van twee stambome objektief te assesseer deur 'n getal te gee wat 'n direkte maatstaf van gedeelde afkoms is. In die meeste menslike bevolkings sal twee individue wat lukraak gekies word, waarskynlik 'n RC van 0 hê, 'n broer en suster 50% en identiese tweeling 100%. Ander verhoudings sal tussen 0 en 50% val.

Die getal wat gegenereer word, kan beskou word as analoog aan die % samestelling, behalwe dat jy twee honde vergelyk in plaas daarvan om na een te kyk. 'n Broer en suster sal 'n waarde van 50% gee solank 'n voorouer nie herhaal word nie. Sodra voorouers begin herhaal, het die individue nie meer 'n intelingskoëffisiënt van nul nie. Twee sibs uit 'n hoogs ingeteelde lyn kan 'n RC van 80% of meer hê, en twee honde wat nie sibs is nie, kan 'n RC bo 50% hê.

Die formule vir die RC is:
RAB = 2fAB ÷ [(1 + FA)(1 + FB)] ½
waar fAB is die intelingskoëffisiënt van 'n hipotetiese werpsel tussen A en B, en FA en F.B is die intelingskoëffisiënte vir die twee individue, A en B.

'n Eenvoudiger benadering tot die teler se probleem sou wees om die RC's vir C vs D en E, en D vs E te bereken. Dit is nie 'n potlood- en papierberekening nie. Met net so 'n probleem, het dit my egter ongeveer 2 minute geneem om die drie RC's met die nuutste weergawe van CompuPed te bekom. My resultate was RCD 10,4%, RCE 13,4%, RDE 17.2%.

Soos D en E die mees algemene afkoms deel, sou die nageslag van hul twee voornemende werpsels ook deel, terwyl C en D die minste deel. Om inteling te minimaliseer en diversiteit te maksimeer, sou hulle my keuse wees, alles anders gelyk. (Hierdie waardes val eintlik almal onder die gemiddelde vir die ras, wat wil sê

Die verwantskapskoëffisiënt

Die fAB term in die RC-vergelyking word soms die "verwantskapskoëffisiënt" genoem en kan ook gebruik word as 'n maatstaf van die verhouding tussen twee individue. Die berekening is dieselfde as dié van 'n intelingskoëffisiënt vir 'n hipotetiese rommel tussen die twee honde. (Dit maak nie saak of hulle dieselfde geslag is nie.)

Die gemiddelde verwantskap (mkek) vir individue ek is is die gemiddelde van die verwantskapskoëffisiënte (fij) tussen ek en al die ander teelbare individue in die populasie:


'n Bewaringsbioloog sal die individu met die laagste verwantskap beteken om die mees geneties waardevolste te wees in terme van die handhawing van diversiteit in die bevolking, en sal probeer om daardie individu in 'n teelprogram te bevoordeel.

Let op: 'n Alternatiewe benadering, wat dikwels na verwys word as die "tabulêre" metode, bereken inteling vanaf die maklikste voorouer na die huidige hond (of honde).

&kopie John B. Armstrong, 1998, 1999


Simulasies

In hierdie afdeling, evalueer ons die waarskynlikheid verhouding benadering om 3/4S van FS en 2de verhoudings te onderskei deur die gebruik van gesimuleerde data. Stambome is gesimuleer vanaf die genetiese data van die individue van die GCAT-projek, deur die ped-sim-metode van Caballero et al. (2019). Ons pas hierdie metode toe om rekening te hou met rekombinasie deur geslagspesifieke genetiese kaarte te gebruik (Bherer et al., 2017) en ook 'n oorkruis-interferensiemodel (Campbell et al., 2015). Die simulasies is soos volg uitgevoer. Eerstens het ons 4147 potensieel onverwante individue met verwantskapskoëffisiënt <0.025 geïdentifiseer. Van hierdie individue het ons 537 488 outosomale SNP's behou met geringe alleelfrekwensie (MAF) > 0.01, Hardy-Weinberg presies middel bl waarde > 0,05 (Graffelman en Moreno, 2013) en ontbrekende oproepkoers nul. Genotipes van die onverwante individue is gefaseer met SHAPEIT4 (Delaneau et al., 2019) en is as insette vir die ped-sim-metode gebruik. Toe het ons 500 stambome gesimuleer wat een FS-paar bevat en 500 stambome wat een 3/4S-paar bevat. In totaal het ons 3000 ewekansige GCAT-individue as stigters gebruik om 3000 kunsmatige individue te genereer. Die aantal gesimuleerde verwante pare was 4 000 PO, 500 FS, 500 3/4S en 3 500 2de graad uit 'n totaal van 17 997 000 pare. Om die IBD-waarskynlikhede en die verwantskapskoëffisiënt vir hierdie gesimuleerde pare te skat, het ons 27 087 SNP's gebruik wat verkry is deur variante met MAF > 0.40 te behou en deur LD-snoei, wat vereis dat merkers lae paarsgewyse korrelasie moet hê (r 2 < 0,20).

Figuur 1 toon die ((>_<0>,>_<1>)) -plot vir hierdie gesimuleerde pare individue. Die IBD-waarskynlikhede is met die PLINK-sagteware beraam (Purcell et al., 2007). Soos verwag, is die beraamde IBD-waarskynlikhede naby aan die verwagte teoretiese waardes van Tabel 1 vir die meeste pare individue. In Fig. 1 toon die 3/4S-verwantskappe goeie skeiding van 2de-graad-verhoudings, maar meng tot 'n mate met FS-pare. Geskatte IBD-waarskynlikhede blyk gesentreer te wees op hul verwagte waardes vir FS-, 3/4S- en 2de-graad-pare, en het groter variansie as PO- en UN-pare. Die diskriminerende krag van ons metode hang deurslaggewend af van die variansie van hierdie beraamde waarskynlikhede (Hill en Weir, 2011).

18 miljoen pare gesimuleerde individue wat 27 087 SNP's gebruik.

VN: onverwante 2de: tweedegraadse verhoudings 3/4S: driekwart broers en susters. FS: vol broers en susters PO: ouer–nasate. Bruin oop kolletjies verteenwoordig teoretiese IBD-waarskynlikhede bruin + tekens die gemiddelde van die ooreenstemmende groep.

Boxplots van die verwantskapberamer wat onlangs voorgestel is deur Goudet & Weir (Goudet et al. (2018), Weir en Goudet (2017)) wat in Fig. 2 getoon word, toon duidelik 'n verskil in mediaan vir 3/4S en 1ste- en 2de-graadverwantskappe , alhoewel die verspreiding van die verwantskapskoëffisiënt van die 3/4S oorvleuel met dié van 1ste en 2de graad pare. Verwantskapskoëffisiënte kan ook identies wees vir verskillende verwantskappe, soos die geval is vir PO en FS. Daarom, volgens Vgl. (3), ons bereken die FS

VN waarskynlikheidsverhoudings vir 500 2de, 500 3/4S en 500 FS gesimuleerde pare. Figuur 3 toon dat FS-pare meestal die grootste LR-waardes in die FS het

VN-verhouding, 3/4S-pare het meestal die grootste LR-waardes in die 3/4S

VN-verhouding en 2de-graad pare het meestal die grootste LR in die 2de

VN. Let op die geplote dataprofiel wat gevorm is in 'n "groter-as"-teken (">")-patroon wat die afleiding van 3/4S vir die meeste 3/4S-pare voorstel. Trouens, die korrekte klassifikasiekoers van die LR-benadering vir die 2de, 3/4S en FS gesimuleerde pare is onderskeidelik 500/500 = 1, 479/500 = 0,958 en 475/500 = 0,95. Wanneer ons die korrekte klassifikasietempo van die LR-benadering vergelyk met die LR-kinbiplot-benadering (Graffelman et al., 2019) gebaseer op 500 FS, 500 3/4S, 3 500 2de en 5 000 VN-gesimuleerde pare (Fig. S1), neem ons waar effens laer klassifikasiekoerse vir 3/4S (478/500 = 0.956) en FS (468/500 = 0.936) deur gebruik te maak van lineêre diskriminantanalise en effens beter klassifikasiekoerse vir 3/4S (481/500 = 0.962) en FS (483/500) = 0.966) wanneer kwadratiese diskriminantanalise as 'n voorspellende model gebruik word. Hierdie simulasies toon dat die voorgestelde LR-benadering nuttig is om 3/4S-verwantskappe van FS- en 2de-graad-verwantskappe te onderskei, en om soortgelyke prestasie te hê as die voorheen voorgestelde LR-kinbiplot-benadering.


Kyk die video: Wiskundige Geletterdheid Gr 12 - Modelle: vloer en hoogte Bereken die skaal (Oktober 2022).