Inligting

Maklike afleiding van Kimura se benadering vir die waarskynlikheid van fiksasie van 'n mutasie

Maklike afleiding van Kimura se benadering vir die waarskynlikheid van fiksasie van 'n mutasie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Kimura se benadering vir die waarskynlikheid van fiksasie van 'n mutasie onder seleksie vind herhalende gebruik in populasie genetika modelle tot op datum. Ek probeer om die wiskundige basis van hierdie vergelyking te verstaan, maar geen van die handboeke of aanlynbronne wat ek nagegaan het, verskaf 'n maklike afleiding van hierdie benadering, maar haal eerder Kimura se 1962-vraestel aan.

$$P_ ext{fix} approx frac{1-e^{-4Nsp} }{1-e^{-4Ns}} qquad (1)$$

So, ek het die oorspronklike vraestel gelees, maar die verskafde afleiding lyk nie vir my duidelik nie.


Besonderhede

Kimura begin met definisie van waarskynlikheid van verandering in alleelfrekwensie as:

$$u(p,t+delta t) = int f(p+delta p; delta t) u(p+delta p,t) d(delta p) qquad (2)$$

waar (presies aangehaal)

  • $u(p,t)$ is die waarskynlikheid dat 'n alleel in 'n tydinterval $t$ vasgestel sal word, gegewe dat die aanvanklike frekwensie $p$ is.
  • $f(p+delta p; delta t)$ is die waarskynlikheidsdigtheid van die verandering van $p$ na $p+delta p$


Dan gebruik hy Taylor-reeksbenadering om 'n vergelyking van hierdie vorm te verkry:

$$frac{partial u(p,t)}{partial t}= frac{V}{2}frac{partial ^2u}{partial p^2}+Mfrac{partial u}{partial p} qquad (3)$$

Hy definieer $M$ en $V$ as gemiddelde en variansie van verandering van $p$ per generasie. Dit word formeel gedefinieer as:

$$M=lim_{delta t o 0} frac{1}{delta t}int (delta p). f(p+delta p; delta t). d(delta p)$$

$$V=lim_{delta t o 0} frac{1}{delta t}int (delta p)^2. f(p+delta p; delta t). d( delta p)$$

($V$ behoort eintlik net die tweede oomblik te wees volgens die wiskundige definisie en nie variansie nie)

Dan los hy vergelyking 3 op by bestendige toestand met randvoorwaardes $u(0,t)=0$ en $u(1,t)=1$ om dit te verkry:

$$u(p)=frac{displaystyleint_0 ^p G(x) dx}{displaystyleint_0 ^1 G(x) dx} qquad (4)$$

waar:

$$G(x)=expleft(-int frac{2M}{V}dx ight)$$

Ek het die afleiding tot op hierdie punt verstaan.

Dan sê hy net:

$$M=sx(1-x)$$ $$V=x(1-x)/2N$$

en kry vergelyking 1.


Kortom

Is daar 'n maklike afleiding vir vergelyking 1?
Indien nie, kan iemand my verduidelik hoe M en V benader is soos hierbo?


Vermoedelik het jy dit opgelos, maar indien nie, is dit omdat die PDE 'n Kolmogorov-agterwaartse vergelyking is, dus is die eerste en tweede orde koëffisiënte die gemiddelde en variansie van die onderliggende stogastiese proses wat gemodelleer word.

In detail, oorweeg 'n stogastiese differensiaalvergelyking (wat 'n oplossing het wat deur 'n Ito-diffusieproses gegee word): $$ dp_t = mu(p_t,t) dt + sigma(p_t,t) dW_t $$ dan geld die volgende stelsel (onder sekere voorwaardes): $$ -frac{partial}{partial t} u(p,t) = mu(p,t)frac{partial}{partial p}u(p,t) + frac{1 }{2}sigma^2(p,t)frac{partial^2}{partial p^2} u(p,t) $$ waar $u$ is die digtheid van $p$ by $t$.

Let daarop dat die drif (infinitesimale gemiddelde) $M=mu(p,t)$ en diffusiekoëffisiënt (infinitesimale variansie) $V=sigma^2(p,t)$ is soos in die koerant (behalwe vir die negatiewe teken, wat ek aanneem ignoreerbaar is, aangesien hy meestal net vir die geval omgee wanneer $partial_t uongeveer 0$ in elk geval). Inderdaad, hulle is ekwivalent geskryf: egin{align} mu(p,t) &= lim_{delta t ightarrow 0}frac{1}{delta t} mathbb{E}left[ p_{t + delta t} - p_t mid p_t=p ight] =: M sigma^2(p,t) &= lim_{delta t ightarrow 0}frac{1}{delta t} mathbb{E }left[ (p_{t + delta t} - p_t)^2 mid p_t=p ight] =: V end{align} soos Kimura skryf.

Let daarop dat 'n nuttige benadering van die oorgangsdigtheid gegee word deur: $$ mathbb{P}[p_{t+delta t} mid p_t] approx mathcal{N}(p_{t+delta t}mid p_t + mu(p_t,t),delta t , sigma^2(p_t,t) ,delta t) ag{TD} $$

Ok, so alles hierbo is net basiese stogastiese prosesse teorie. As ons dus 'n stogastiese model vir die populasiedinamika het, kan ons waardes aflei vir $M$ en $V$ daarvan (deur die oomblikke daarvan te bereken), en dit sal oorgedra word na die agterlike Kolmogorov-vergelyking, waarop Kimura se werk berus.

Hier is waar my onkunde oor bevolkingsdinamika wys. Aangesien Kimura Fisher en Wright noem, het ek egter die Wright-Fisher-model opgesoek. Dit wil voorkom asof Kimura die verspreidingsprosesbenadering van die Wright-Fisher-model gebruik. Dit blyk 'n goed bestudeerde model te wees wat ek nie volledig hier kan beskryf nie; in plaas daarvan het ek die werk van Tataru et al. Statistiese afleiding in die Wright-Fisher-model deur alleelfrekwensiedata te gebruik om 'n uitstekende beskrywing daarvan te wees, hoewel ek nie voorgee om veel daarvan te verstaan ​​nie.

Wat egter belangrik is, is dat die verandering in gene (oorgangsdigtheid) deur 'n binomiale verspreiding beskryf kan word. Dit kan benader word deur 'n normale verspreiding: $$ mathbb{P}[p_{t+delta t} mid p_t] approx mathcal{N}(p_{t+delta t}mid p_t + a(p_t) delta t,, p_t ( 1-p_t) delta t ) $$ met behulp van die standaardbenadering tot die binomiaal. Dit gee ons dan 'n vorentoe Kolomogorov-vergelyking (nie agteruit nie) geskryf: $$ frac{partial}{partial t} u = - frac{partial}{partial p}left[a(p_t) u(p_t) ight] + frac{1}{2} frac{partial^2}{partial p^2} left[ p_t(1-p_t)u(p_t) ight] $$ Dit impliseer basies dat $V=p(1-p)$.

(Ek het opgemerk dat 'n ander manier om dit te bewys is om op te let dat die Wright-Fisher benaderde diffusie (sonder enige keuses, ens ... so $aequiv 0$) het 'n oneindige generator gegee deur: $ mathfrak{G} f(p) = p(1-p)partial_{tt} f(p) / 2 $. Dit impliseer onmiddellik $V=p(1-p)$. Maar dit is dalk minder eenvoudig om te verstaan. )

Verwarrend egter, het die vraestel tydskale (veranderlikes) verander sodat $delta t leftarrow Delta t / (2N)$, en stel dan $delta t$ aan $1$ (waarskynlik sodat hulle nie hoef te skryf nie $2N$ oral). As ons hierdie transformasie ongedaan maak, kry ons $$ mathbb{P}[p_{t+delta t} mid p_t] approx mathcal{N}(p_{t+delta t}mid p_t + a(p_t) delta t,, p_t ( 1-p_t) delta t/(2N) ) $$ As jy dit vergelyk met ons benaderde oorgangsdigtheid hierbo (vergelyking (TD)), sal jy sien dat dit impliseer: $$ sigma^2 = V = p(1-p)/[2N] $$ Soos verlang.

Nou, wat is die oneindige gemiddelde, m.a.w. $a$ of $M$? Dit hang duidelik van die seleksiemodel af, aangesien dit beheer hoe die "omgewing" die proses deterministies beïnvloed. Kimura beskryf dit as 'n "konstante seleksie-voordeel" met koëffisiënt $s$. Die Tataru-vraestel merk op dat die diffusiebenadering na Wright-Fisher onder genetiese drywing, mutasie en seleksie gegee word deur: $$ a(p) = - u p + xi(1-p) + 2N au p(1-p)[h-(1-2h)p] $$ As ons (1) mutasie ignoreer deur te stel $ u=xi=0$, (2) verwyder alleliese dominansie-effekte deur instelling $h=1/2$, en (3) definieer $s:= N au$, ons kry: $$ a(p) = s p(1-p) =: M $$ wat ons natuurlik sien deur op te let $M=a(p)$ wedstryde $mu$ in die vergelyking (TD) hierbo. (Let daarop dat die $2N$ transformasie het ook hier plaasgevind, maar dit was binne weggesteek $s$).

So, ons het afgelei waar Kimura s'n $M$ en $V$ vandaan kom, al is dit waarskynlik nie op die eenvoudigste moontlike manier nie.

Al wat oorbly is om die (bestendige-toestand) vergelyking vir af te lei $u$. Ek dink ek sal dit vir volledigheid doen.

As ons die bestendige-staat-intekeninge ignoreer, kry ons: egin{align} G(x) &= expleft( -int frac{2M}{V} dx ight) = expleft( -int 4sN dx ight) = expleft ( -4sNx ight) [0.15cm] u(p) &= frac{displaystyle int_0^p G(x) dx}{displaystyle int_0^1 G(x) dx} = frac{ displaystyle frac{1}{4Ns}left[ expleft( -4sNx ight) ight]_0^p}{displaystyle frac{1}{4Ns}left[ expleft( - 4sNx ight) ight]_0^1} = frac{displaystyle -left[ expleft( -4sNp ight) - 1 ight]}{displaystyle -left[ expleft( - 4sN ight) -1 ight]} &= frac{1 - exp(-4Nsp)}{1 - exp(-4Ns)} end{align} soos vereis.


Verskoning vir enige foute. (Ek is nie 'n bevolkingsdinamika-modelleerder of 'n wiskundige nie, so wys asseblief enige probleme uit).


Kyk die video: FSB Računalna matematika: zadaci za vježbe iz aproksimacije i interpolacije 2. dio (Oktober 2022).