Inligting

2.9: Organellêre Genome - Biologie

2.9: Organellêre Genome - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

In eukariote bestaan ​​DNS en gene ook buite die chromosome wat in die kern gevind word. Beide die chloroplast en mitochondrion het sirkelvormige chromosome (Figuur (PageIndex{22})). In die meeste seksueel voortplantende spesies, organellêre chromosome word van slegs een ouer geërf, gewoonlik die een wat die grootste gameet produseer. By soogdiere, angiosperme en baie ander organismes word mitochondria en chloroplaste dus slegs deur die moeder (moederlik) geërf.

Hierdie organelle is waarskynlik die oorblyfsels van prokariotiese endosimbionte wat die sitoplasma van antieke stamvaders van vandag se eukariote binnegegaan het (endosymbiont teorie). Hierdie endosimbionte het hul eie, sirkelvormige chromosome gehad, soos die meeste bakterieë wat vandag bestaan. Chloroplaste en mitochondria het tipies sirkelvormige chromosome wat meer soos bakteriële chromosome optree as eukariotiese chromosome, dit wil sê hierdie organellêre genome ondergaan nie mitose of meiose nie.


Organellêre genomika: 'n nuttige hulpmiddel om evolusionêre verwantskappe en molekulêre evolusie in Gracilariaceae (Rhodophyta) te bestudeer

Gracilariaceae het 'n wêreldwye verspreiding wat talle ekonomies belangrike spesies insluit. Ons het hoë-deurset-volgordebepaling toegepas om organellêre genome (mitochondria en chloroplast) van 10 spesies Gracilariaceae te verkry en, gekombineer met gepubliseerde genome, om filogenieë af te lei en genoomargitektuur te vergelyk tussen spesies wat hooflyne verteenwoordig. Ons het soortgelyke topologieë tussen chloroplast en mitochondriale genome filogenieë verkry. Die chloroplastfilogenie is egter beter opgelos met volle ondersteuning. In hierdie filogenie is Melanthalia intermedia die suster van 'n monofiletiese klade wat Gracilaria en Gracilariopsis insluit, wat albei as monofiletiese genera opgelos is. Mitochondriale en chloroplastgenome was hoogs behoue ​​in geen sintenie, en variasie het hoofsaaklik voorgekom in streke waar invoegings van plasmied-afgeleide volgordes (PDS) gevind is. In mitochondriale genome is PDS-invoegings waargeneem in twee streke waar die transkripsierigting verander: tussen die gene cob en trnL, en trnA en trnN. In chloroplastgenome was PDS-invoegings in verskillende posisies, maar word gewoonlik tussen psdD- en rrs-gene gevind. Gracilariaceae is 'n goeie modelstelsel om die impak van PDS in genoom-evolusie te bestudeer as gevolg van die gereelde teenwoordigheid van hierdie invoegings in organellêre genome. Verder is die bakteriële leuC/leuD operon gevind in chloroplastgenome van Gracilaria tenuistipitata, G. chilensis en M. intermedia, en in ekstrachromosomale plasmied van G. vermiculophylla. Filogenetiese bome toon twee verskillende oorspronge van leuC/leuD: gene wat in chloroplast en plasmied gevind word, is saam met proteobakterieë geplaas, en gene wat in die kern gekodeer is, was naby Viridiplantae en sianobakterieë.

Sleutelwoorde: chloroplast geen sinteny genoom argitektuur mitochondria filogenomics plasmied-afgeleide volgordes plasmiede.


Agtergrond

Organellêre genome word wyd gebruik as 'n bron van genetiese inligting in evolusionêre studies, hoofsaaklik as gevolg van die haploïede karakter en die teenwoordigheid in honderde tot duisende kopieë in elke sel [1, 2]. In die meeste bekende organismes word die mitogenome en plastome moederlik geërf, wat lei tot die teenwoordigheid van slegs enkele haplotipes van hierdie genome in die organisme. Verskeie studies het heteroplasmie van plastiedgenome beskryf [3], maar die meeste van die studies het egter nie intra-individuele polimorfisme [4, 5] geopenbaar wat organellêre genome ondersteun as 'n hulpbronne vir evolusionêre studies nie.

Die volgordes van volledige mitochondriale genome word hoofsaaklik gebruik in filogenetika, filogeneografie en populasiegenetika van diere en swamme [6,7,8], terwyl in plantwetenskappe plastiedgenome hoofsaaklik vir hierdie doeleindes gebruik word.

In vergelyking met die saadplante word die organellêre en veral plastiedgenome swak ondersoek in briofiete. Tot op datum is slegs 15 plastied- en 48 mitochondriale volledige genoomvolgordes bekend vir briofiet-genera. Boonop behoort die meeste geselekteerde genome aan net vier mosfamilies Funariaceae [9], Grimmiaceae [10, 11], Orthotrichaceae [12,13,14,15] en Sphagnaceae [16].

Die mitochondriale genome van vroeë landplante is bekend uit hul stabiele struktuur in vergelyking met die saadplante [12, 17]. Die lewermosse is die oudste evolusionêre afkoms van sporofitiese plante en die mees geneties diverse. Ten spyte van hoë nukleotiedvariasie op inter- en intrageneriese vlak bly die geeninhoud en -orde egter byna onveranderd sedert die diepste nodusse van lewerworteldiversifikasie [18,19,20]. Die enigste waargenome veranderinge was die intronverliese van atp1 en cox1-gene in die blaaragtige lewermosse-groep [20] en pseudogenisering van die nad7-geen in die meerderheid van die lewermosse behalwe van Treubia lacunosa [18].

Hierdie stabiliteit blyk geassosieer te word met die gebrek aan herhalende volgorde in die mitogenome van vroeë landplante, wat algemeen in saadplante voorkom [12]. Die mitogenome van die lewermosse is egter swak verken, selfs in vergelyking met die mosse, waar opgedateerde volledige mitochondriale genome-volgorde van 6 genera bekend is.

Die beskikbare data is selfs skaarser in die geval van chloroplastgenome, beperk tot die genera Marchantia, Pellia, Aneura en Ptilium.

Die lewermos Gymnomitrion concinnatum (Lightf.) Corda behoort aan die familie Gymnomitriaceae H. Klinggr. Hierdie groep sluit tien genera in (Acrolophozia, Apomarsupella, Gimnomitrion, Herzogobryum, Marsupella, Nanomarsupella, Nothogymnomitrion, Paramomitrion, Poeltia, en Prasanthus), waarvan die meeste is Gimnomitrion (27 spesies) en Marsupella (26 spesies) [21]. Histories is slegs twee wydverspreide genera (Gimnomitrion en Marsupella) is as deel van Gymnomitriaceae beskou. Gebaseer op die omskrywing van die genus Gimnomitrion aangebied deur Váňa et al. [21] is daar sewe spesies wat in Pole en Slowakye aangeteken is. Die meeste van hulle groei in die Tatra-berge (Wes-Karpaten). Gymnomitrion concinnatum is acidophilus, epilitiese en epigeiese lewermos wat groei op magma (graniet) en metamorfe (meestal gneissiese) gesteentes en kristallyne leisteen. Meestal kom dit op rakke en skeure van rotswande voor, minder dikwels in los alpiene (en subnavale) grasvelde en sneeubeddings met die oorheersing van briofiete [22]. Van Sentraal-Europa, phytocoenoses met 'n hoë voorkoms van G. concinnatum beskryf is as Gymnomitrietum concinnati Herzog 1943 bv Philippi 1956 (klas: Grimmietea alpesris Hadač et Vondráček in Ježek et Vondráček 1962) (vergelyk [22,23,24,25]). Die bekende genetiese hulpbronne van die Gymnomitriaceae is beperk tot die volgordes van ITS en drie chloroplast lokusse [26, 27] van die genera Gimnomitrion, Herzogobryum, Marsupella en Prasanthus.

In die huidige studie het ons organellêre genome van die volgorde, saamgestel, geannoteer en ontleed Gymnomitrion concinnatum, wat nuwe insigte verskaf oor evolusie van mitogenome en plastome in lewerwortels.


Kragte wat organellêre genome handhaaf: is enige so sterk soos genetiese kodeverskil of hidrofobisiteit?

Departement Genetika, Universiteit van Cambridge, Downingstraat, Cambridge CB2 3EH, VK.

Departement Genetika, Universiteit van Cambridge, Downing Street, Cambridge CB2 3EH, VK. Soek vir meer referate deur hierdie skrywer

Departement Genetika, Universiteit van Cambridge, Downingstraat, Cambridge CB2 3EH, VK.

Departement Genetika, Universiteit van Cambridge, Downing Street, Cambridge CB2 3EH, VK. Soek vir meer referate deur hierdie skrywer

Abstrak

Dit bly omstrede waarom mitochondria en chloroplaste die gene behou wat 'n klein subset van hul samestellende proteïene kodeer, ten spyte van die oordrag van soveel ander gene na die kern. Twee kandidaat-hindernisse vir geenoordrag, wat lank gelede voorgestel is, is dat die genetiese kode van sommige mitochondriale genome verskil van die standaard kernkode, sodat 'n oorgeplaaste geen 'n verkeerde aminosuurvolgorde sal kodeer, en dat die proteïene wat die meeste in mitochondria gekodeer word, is oor die algemeen baie hidrofobies, wat hul invoer na sintese in die sitosol kan belemmer. Meer onlangs is daar voorgestel dat beide hierdie interpretasies aan ernstige "vals positiewe" en "vals negatiewe" ly: gene wat hulle voorspel moet geredelik oorgedra word, maar wat nog nooit (of selde) was nie, en gene wie se oordrag dikwels of vroeg plaasgevind het , al word voorspel dat dit baie moeilik sal wees. Hier beskou ek die volle bekende reeks oënskynlik problematiese sulke gene, met spesifieke verwysing na die volgorde van gebeure wat tot hul huidige ligging kon gelei het. Ek wys dat hierdie gedetailleerde ontleding van hierdie gevalle aan die lig bring dat hulle in werklikheid heeltemal in ooreenstemming is met die hipotese dat kodeverskil en hidrofobisiteit baie kragtiger hindernisse vir funksionele geenoordrag is as enige ander. Die gewildheid van die teenoorgestelde siening het gelei tot die soeke na ander hindernisse wat gene in organelle selfs kragtiger kan behou as kodeverskil of hidrofobisiteit. Een voorstel, wat die rol van proteïene in redoksprosesse betref, het wydverspreide steun gekry. Ek kom tot die gevolgtrekking dat hierdie verlating van die oorspronklike verduidelikings vir die behoud van organellêre genome voortydig was. Verskeie ander, relatief geringe, struikelblokke vir geenoordrag bestaan ​​beslis, wat bydra tot die behoud van relatief baie organellêre gene in die meeste geslagte in vergelyking met diere-mtDNA, maar daar is geen bewyse vir struikelblokke so ernstig soos kodeverskil of hidrofobisiteit nie. Een gevolg van hierdie gevolgtrekking is dat daar tans geen rede is om te veronderstel dat ingenieurswese-kernweergawes van die oorblywende soogdiermitochondriale gene, 'n prestasie wat wydverspreide biomediese relevansie kan hê, enigiets anders as volgordeveranderings moet vereis wat kode-ongelykheid vermy en beskeie vermindering in hidrofobisiteit veroorsaak. sonder verlies van ensiematiese funksie. BioEssays 27:436–446, 2005. © 2005 Wiley periodicals, Inc.


Resultate en bespreking

Alle swaar geredigeerde kodons kodeer aminosure met aansienlik verskillende hidrofobisiteit en molekulêre grootte as vooraf geredigeerde kodons, en redigering verhoog die hidrofobisiteit van proteïene aansienlik.

Hidrofobisiteit en molekulêre grootte is twee fundamentele fisies-chemiese eienskappe van aminosure wat proteïenstruktuur en -funksionaliteit bepaal, en natuurlik beïnvloed dit die aminosuurvervangingstempo tydens proteïenevolusie grootliks [47]. In ons ontledings van redigeerfrekwensies van kodons en die ooreenstemmende aminosuurveranderinge wat betrokke is, het ons gevind dat die veranderinge van Ser → Leu-kodons die hoogste klas omskakelings verteenwoordig vir die 2 de kodonposisie-redigering in beide chloroplaste en mitochondria, en dat die veranderinge van Ser → Phe-kodons en Pro → Leu-kodons neem die volgende twee plekke in die rangorde in deur die frekwensie te wysig.

Saam is hierdie drie klasse verantwoordelik vir 73–98% van die redigeringsgebeurtenisse by die 2de kodonposisies en 49–68% van alle redigeringsgebeure in die twee organelle (Figure 1, 2). Vir die redigering van die 1ste kodonposisie neem die veranderinge van Arg → Trp-kodons altyd die voortou, met dié van Arg → Cys-kodons, Pro → Ser-kodons, en His → Tyr-kodons wat baie van die oorblywende redigeringsgebeure verantwoordelik is, weer in beide organelle. Al hierdie aminosuurveranderinge behels groot verskille van hidrofobisiteit en molekulêre grootte soos gemeet deur die Grantham-indeks [47] en die Kyte-Doolittle-hidrofobisiteitskaal [48].

Daarbenewens word 'n soortgelyke patroon waargeneem oor die

15–44 C→U-redigeerplekke wat in die chloroplastgenome van saadplante gevind word [15, 22, 26, 30–37].

Vir omgekeerde redigering in chloroplaste van albei A. formosae en A. capillus-veneris, behels die hoogste klas omskakelings drie stopkodons, wat na Arg- of Gln-kodons omgeskakel word na redigering by 1ste kodonposisies, en hulle verteenwoordig 60% en 77% van alle omgekeerde redigeringsgebeurtenisse by hierdie kodonposisie. Die belangrikheid van hierdie klas redigering op proteïenfunksionaliteit is vanselfsprekend. Die veranderinge van Cys → Arg-kodons en Leu → Pro-kodons verteenwoordig die meeste oorblywende redigeringsgebeurtenisse by onderskeidelik 1ste en 2de kodonposisies. Daar is 'n paar ander klasse kodonveranderinge wat die gevolg is van redigering wat ook veranderinge van funksioneel baie verskillende aminosure behels, maar hulle kom teen baie laer frekwensies voor as dié wat hierbo genoem is. Laastens is daar 'n klein aantal redigeringsgebeurtenisse wat veranderinge van funksioneel soortgelyke aminosure veroorsaak of glad nie aminosuuridentiteit verander nie (Figure 1, 2). Ons het egter geen geval gevind van swaar redigering vir kodonvervangings wat translasie stil is of min verandering van die fisies-chemiese eienskappe van aminosure behels het nie.

Hierdie data dui duidelik en konsekwent daarop dat RNA-redigering 'n belangrike funksionele rol speel in die minimalisering van effek van mutasies wat proteïenstruktuur grootliks sou verander het deur aminosuurvervanging wat drastiese veranderinge in hidrofobisiteit en molekulêre grootte behels. Vroeëre studies het die herstel van bewaarde aminosure gerapporteer deur te wysig [3–5, 11, 13, 15, 16], maar die patrone, en boonop die konsekwentheid van hierdie patrone, in beide chloroplast- en mitochondriale genome van sulke diverse landplante wat hier gewys word is regtig treffend, en hulle is gebaseer op baie meer uitgebreide data as daardie vroeëre studies.

Voorheen is daar ook getoon dat redigering in transkripsies van tRNA-gene, vermeende Shine-Dalgarno-volgordes en groep II-introne die strukturele vou of basisparing van daardie molekules verbeter [8, 11, 13, 49, 50].

Onlangs het Mower en Palmer [14] ook gevind dat in die mitochondriale genoom van B. vulgaris, was gedeeltelike redigering baie meer wydverspreid by stil plekke (58.5%) as nie-stil webwerwe (8.0%), 'n verskynsel wat vroeër op enkele gene gerapporteer is [51, 52]. Selfs al is gedeeltelike redigering moontlik redigering wat aan die gang is in intermediêre reaksieprodukte verteenwoordig [53] is die teenstrydigheid in stil en nie-stil webwerwe meer in ooreenstemming met 'n funksionele verduideliking. Daarom ondersteun hierdie data en waarnemings van vorige studies ondubbelsinnig 'n rol van natuurlike seleksie in die handhawing van RNA-redigeringsaktiwiteit in plantorganelle [24].

Nog 'n waarneming wat ons uit hierdie data gemaak het, is dat redigering in chloroplaste of mitochondria van hierdie vyf plante proteïenhidrofobisiteit eenvormig verhoog wanneer ons aminosuurveranderinge van redigeringsgebeurtenisse ondersoek het met behulp van die Kyte-Doolittle-hidropatieskaal van aminosure [48]. Selfs in A. formosae waar byna 'n gelyke aantal voorwaartse en omgekeerde redigeringsgebeurtenisse gerapporteer is, hou hierdie toename in proteïenhidrofobisiteit steeds vas omdat 'n groot deel van omgekeerde redigeringsgebeurtenisse betrokke was by die herlewing van interne stopkodons en nie die hidrofobiese toename wat deur voorwaartse redigeergebeure gegenereer is, verreken het nie (Figuur 1a, b). Hierdie verskynsel is vroeër waargeneem in mitochondria van A. thaliana [8] en in chloroplaste van A. formosae [11]. Nou lyk dit redelik om voor te stel dat die verskynsel meer wydverspreid in landplante voorkom as wat voorheen bekend was en kan van toepassing wees op die meeste RNA-redigeringsgebeurtenisse in organelle van die meeste landplante. As dit die geval is, kan 'n mens wonder of daar enige funksionele rede agter hierdie patroon van aminosuurveranderinge is wat deur RNA-redigering bemiddel word, wat nader aan die antwoord op die legkaart van oorsprong van RNA-redigering in plantorganelle kan lei.

Plantorganellêre genome bevat buitensporige groot persentasies gene wat kodeer vir membraangebonde proteïene wat ryk is aan hidrofobiese aminosure

Na hul endosimbiotiese oorsprong van sianobakterieë en proteobakterieë, het chloroplaste en mitochondria organelle in eukariotiese selle geword wat in energiemetabolisme spesialiseer. Hulle bevat albei twee groot stelle gene, een stel kodeer proteïene vir óf fotosintese óf aërobiese respirasie en die ander stel kodering proteïene vir inligtingverwerking, naamlik geentranskripsie, -splyting en translasie [27, 54, 55].

Terwyl proteïene wat betrokke is by inligtingverwerking, Calvin-siklus in chloroplaste en Krebs-siklus in mitochondria oplosbare is wat in stroma of matriks geleë is (eintlik is die meeste van die gene wat hierdie proteïene kodeer reeds na die kern oorgedra na endosimbiose), diegene wat betrokke is by fotonvang (fotosisteem) proteïene) en fotofosforilering (elektrondraers en ATPase) in chloroplaste en oksidatiewe fosforilering (elektrondraers en ATPase) in mitochondria is alles ingebed in fosfolipied dubbellaagmembrane. Dit is dus duidelik dat hierdie twee organelle baie groter persentasies gene huisves wat vir membraangebonde proteïene kodeer as hul vrylewende bakteriese voorouers of die kern van die eukariotiese sel [27, 54, 55].

Toe ons die voorkomsfrekwensies van 20 aminosure in twee klasse proteïene ondersoek wat deur chloroplast en mitochondriale genome van A. formosae en B. vulgaris, onderskeidelik, het ons gevind dat hidrofobiese aminosure soos Leu, Ile, Phe, Val, Gly, Ser en Ala baie meer gereeld as hidrofiele soos His, Trp, Arg en Lys in die membraangebonde proteïene gebruik is (Figuur 3) . Leu was deurgaans die hoogste onder al 20 aminosure in membraangebonde proteïene van beide organelle. In oplosbare proteïene is geen so 'n uitgesproke vooroordeel in aminosuurgebruik waargeneem nie, en eerder hidrofiele aminosure soos Arg en Lys is soveel gebruik as hidrofobiese soos Leu en Ile (Figuur 3). Hierdie data pas by basiese fisiese-chemie-verwagting deurdat die oorvloed van membraangebonde proteïene in chloroplaste en mitochondria natuurlik die gereelde gebruik van hidrofobiese aminosure in die sintetisering van hierdie proteïene dikteer. Aangesien geeninhoude in beide organellêre genome evolusionêr deur landplante bewaar is, kan aanvaar word dat die bogenoemde patroon van aminosuurgebruik wat by die twee spesies waargeneem is, die algemene patroon van aminosuurgebruik in beide organelle van alle landplante verteenwoordig.

Ondersoek van die genetiese kodetabel toon dat alle kodons met U op die 2de posisies hidrofobiese aminosure kodeer: Leu, Ile, Phe, Val en Met. Die feit dat Leu die hoogste voorkomsfrekwensie het in beide organel-gekodeerde proteome wat hierbo getoon word (Figuur 3) en gekodeer word deur ses kodons almal met U op die 2 de posisies kan nou verduidelik waarom Ser → Leu en Pro → Leu kodon veranderinge verteenwoordig die twee mees gereelde klasse van redigering gebeurtenisse waargeneem in ons studie (Figure 1, 2). Hierdie data demonstreer onomwonde die funksionele basis van RNA-redigering in plantorganellêre genome.

RNA-redigeerplekke kom meer gereeld voor in voorvaderlike T-ryke volgordes, wat meer volop is in gene wat kodeer vir membraangebonde proteïene met baie hidrofobiese aminosure

Om die volgorde-omgewing waarin RNA-redigeerterreine ontwikkel het te verstaan, het ons korrelasie tussen redigeerfrekwensie en T-A- en C-G-afstand oor verskillende gene ondersoek. Laasgenoemde meet die hoeveelheid oormaat T bo A, en C oor G, by sekere kodonposisies, onder die aanname dat DNS-volgordes in 'n genoom na T = A en C = G ontwikkel in lyn met die 'tweede pariteitsreël' [ 56]. Vir ontledings van mitochondriale gene in A. thaliana, B. vulgaris, en O. sativa ons bied slegs die resultate aan B. vulgaris aangesien korrelasies baie dieselfde was in grootte en verspreiding (Figuur 5 Addisionele lêer 1).

Die korrelasie van redigeerfrekwensie en T-A-afstand by die 2 tweede en 1 st kodonposisies in die mitochondriale genoom van B. vulgaris (a, b). Membraangebonde proteïenkoderende gene word deur rooi kolletjies aangedui, terwyl oplosbare proteïenkoderende gene as blou driehoeke aangebied word. Regressieresultate is betekenisvol vir alle aangebied ontledings (p < 0.01) met besonderhede wat in elke figuur getoon word.

By die 2de kodonposisies was daar 'n positiewe korrelasie tussen hierdie twee parameters in die drie genome wat ons ondersoek het: chloroplastgenome van A. formosae en A. capillus-veneris en die mitochondriale genoom van B. vulgaris (Figure 4a, b, 5b). Met ander woorde, in gene wat groter T-A-afstande getoon het of 'n oormaat T bo A in hul rye gehad het, was daar meer redigeringsgebeurtenisse. Hierdie positiewe korrelasie tussen redigeerfrekwensie en T-A-afstand is ook by die 1ste kodonposisies in die mitochondriale genoom gesien (Figuur 5a). Soos verwag, is 'n beduidende negatiewe korrelasie tussen die frekwensie van omgekeerde redigering en T-A-afstand gevind by 1ste kodonposisies in die chloroplastgenoom van A. capillus-veneris (Figuur 4c), maar nie in dié van A. formosae (Bykomende lêer 1). Hierdie bevindings is nie onverwags nie, aangesien wanneer daar oorvloed van T in 'n geen was, 'n mens meer T→C mutasies sou verwag, wat dan vasgestel sou word en later C→U veranderinge tydens redigering ervaar as gevolg van die bestaan ​​van die redigeermasjinerie. Interessant genoeg het T-A-afstand vir 3de kodonposisies geen korrelasie getoon oor al die redigeerfrekwensievergelykings nie (Bykomende lêer 1).

Die ander waarneming wat ons uit hierdie data gemaak het, was dat die gene wat vir membraangebonde proteïene kodeer, geneig is om groter T-A-afstande in hul rye te hê en dus meer redigeergebeurtenisse (Figure 4, 5). Al die gene wat aan die hoë punte van die korrelasie plotte is, kodeer vir membraangebonde proteïene, terwyl die meeste van die wat aan die lae punte van die plotte geleë is, kodeer vir oplosbare proteïene. Hierdie data stem weer ooreen met die idee wat ons hierbo geformuleer het dat die hoë proporsie membraangebonde proteïene in plantorganel-gekodeerde proteome verantwoordelik blyk te wees vir die voorkoms van RNA-redigering in hierdie twee genome.

In hierdie korrelasie-ontledings is die volgordes van volwasse transkripsies gebruik, wat gebaseer was op 'n implisiete aanname dat die geredigeerde volgorde 'n voorvaderlike toestand verteenwoordig en die vooraf geredigeerde volgorde 'n afgeleide toestand verteenwoordig. Met ander woorde, daar is aanvaar dat RNA-redigering onlangs in eukariotiese evolusie ontwikkel het. Baie vorige studies het inderdaad waargeneem dat redigering oor die algemeen evolusionêr bewaarde aminosure herstel [3–5, 11, 13, 15, 16]. Dit is ook getoon dat slegs 'n klein aantal redigeringsterreine evolusionêr oor landplante in die chloroplastgenoom bewaar word [7, 13, 15, 26]. Dieselfde geld in mitochondriale genome van A. thaliana, B. vulgaris en O. sativa slegs 118 werwe (21%) van 'n totaal van 561 redigeerwerwe is volgens ons ondersoek deur hierdie drie diverse angiosperme gedeel. Die aanname wat ons in die korrelasie-ontledings gebruik het blyk dus geldig te wees.

Redigeringswebwerwe word meer gereeld gevind in selektief-beperkte gene

As gevolg van die duidelike funksionele basis van RNA-redigering wat hierbo gedemonstreer is, het ons vermoed dat RNA-redigering sou toeneem in ooreenstemming met die seleksiebeperking op gene. Ons het toe moontlike korrelasie van geenspesifieke evolusietempo ondersoek, by beide sinonieme (d S) en nie-sinoniem (d N) webwerwe, met totale RNA redigering frekwensie. Hierdie ontledings is uitgevoer oor gene van A. formosae, A. capillus-veneris, A. thaliana, B. vulgaris, en O. sativa (Figuur 6). Redigeringsfrekwensiedata het alle kodonposisies ingesluit, en chloroplast-redigeerdata het beide vorentoe- en omgekeerde redigeringsfrekwensies gekombineer.

Die korrelasie van totale redigering frekwensie en geen spesifieke tempo van molekulêre evolusie by nie-sinoniem ( d N) (a, c) en sinoniem ( d S) (b, d) plekke in chloroplastgenome van A. formosae en A. capillus-veneris (a, b), en mitochondriale genome van A. thaliana , B. vulgaris , en O. sativa (c, d). Vaste punte (rooi) dui op membraangebonde proteïene, terwyl oop punte (blou) oplosbare proteïene verteenwoordig. Data vir A. formosae word as driehoeke getoon, terwyl A. capillus-veneris word as sirkels (a, b) voorgestel. Data vir A. thaliana, B. vulgaris, en O. sativa word onderskeidelik as vierkante, driehoeke en sirkels aangebied (c, d).

Aanvanklik is die korrelasies verwar deur die effek van redigeerwebwerwe self, wat, wanneer dit by die skatting van molekulêre evolusionêre tempo's ingesluit is, sirkulariteit sou oproep wanneer dit vergelyk word met redigeringsfrekwensie. Daarbenewens het gereelde in-raam stopkodons in baie chloroplastgene met die ontleding ingemeng. Om hierdie probleme te oorkom, het ons redigeerwerwe uit die ontledings verwyder deur die webwerwe na die voorvaderlike basisse om te skakel.

Die resultate wat vir beide genome verkry is, dui daarop dat gereeld geredigeerde membraangebonde gene onder sterker seleksiebeperking is as dié vir oplosbare proteïene (Figuur 6a, c).

Ons het ook vasgestel dat daar min verband is tussen redigeerfrekwensie en sinonieme tariewe (Figuur 6b, d), wat 'n benadering is van die neutrale mutasietempo.

Hierdie bevindinge staaf die waarneming van verminderde redigeerfrekwensie in chloroplastgenome van twee parasitiese plante [15], waarin baie behoue ​​gene verminderde seleksiedruk ondergaan het in twee verskillende spesies uit dieselfde afstammelinge [57].

Het RNA-redigering in plantorganellêre genome ontstaan ​​onder natuurlike seleksie of deur genetiese drywing?

Sedert die ontdekkings van RNA-redigering in plantorganellêre genome [3-6], is genetici en molekulêre evolusioniste geïntrigeerd deur die vraag hoe RNA-redigering in die eerste plek ontwikkel het [8, 24-26]. Onlangs het Tillich et al. [26] het 'n patroon ontbloot wat 'voorkeurvolgorde-konteks' genoem word waarin daar 'n voorkeur kan wees vir pirimidiene onmiddellik stroomop, en puriene onmiddellik stroomaf van 'n redigeringswerf. So 'n patroon kan belangrik wees vir werfherkenning deur die RNA-redigeermasjinerie. In 'n vroeëre studie het Covello en Gray [24] die komplekse vraag insiggewend in drie dele ontleed: 1) die oorsprong van RNA-redigeeraktiwiteit, 2) fiksasie van mutasies by redigeerbare plekke, en 3) instandhouding van RNA-redigeringsaktiwiteit. Verder het hulle veronderstel dat genetiese drywing 'n sleutelrol in die eerste twee prosesse gespeel het en natuurlike seleksie het bygedra tot die derde. Sommige skrywers huldig 'n selfs meer neutralistiese siening oor die oorsprong van RNA-redigering as hierdie twee outeurs, bv. Lynch et al. [25]. Hieronder bied ons ons idees aan of RNA redigering ontstaan ​​het onder natuurlike seleksie of deur genetiese drywing gebaseer op die ontledings hierbo getoon. Om die argument makliker te maak om volgens sterkte van die data te konstrueer, volg ons 'n omgekeerde volgorde van die drie stappe wat deur [24] voorgestel word.

Instandhouding van RNA redigering aktiwiteit

In ooreenstemming met [24], dink ons ​​dat die data oorweldigend is in die ondersteuning van 'n rol van natuurlike seleksie in die handhawing van RNA-redigeringsaktiwiteit in organelle van plante, ten spyte van 'n swak begrip van die biochemiese aard daarvan tot nou toe. Sonder redigering sal die vervanging van soveel aminosure met baie verskillende fisies-chemiese eienskappe proteïenstrukture dramaties verander, indien nie hierdie proteïene heeltemal disfunksioneel maak nie (Figure 1, 2). Die mees ekstreme geval is die chloroplastgenoom van A. formosae, waar vorentoe en omgekeerde redigering gebeure meer as die helfte van die gene in die genoom beïnvloed [11]. Daarbenewens word stop- en beginkodons dikwels geskep of verwyder deur te wysig [11, 13, 14]. Net so sal tRNA's, groep II-introne en vermeende Shine-Dalgarno-volgordes wat redigeringswebwerwe bevat ook waarskynlik beïnvloed word as redigeringsaktiwiteit verlore gaan [8, 11, 13, 49, 50]. Daarom sal ons nie hier verder op hierdie punt uitwei nie.

Bevestiging van mutasies by bewerkbare werwe

Dit is die beginpunt waar ons siening verskil van dié van [24] oor hoe RNA-redigering ontwikkel het. As mutasies by bewerkbare terreine deur genetiese drywing vasgestel is, sou 'n mens verwag dat hul verspreidingspatrone heeltemal ewekansig sou wees wanneer dit ondersoek word teen kodonposisies, tipes kodons en soorte gene. Ons ontledings het egter genoeg data verskaf om hierdie scenario te weerspreek. Eerstens het ons gevind dat redigeringswebwerwe hoofsaaklik op 2de en 1ste kodonposisies versprei is (Figure 1, 2), soos gerapporteer deur vorige studies [8, 10, 11, 13–15, 20] en hier is gevind dat dit gekorreleer is oor gene vir alle taksa wat ondersoek is (Bykomende lêer 1).

Tweedens, redigering van geaffekteerde kodons wat gelei het tot groter hidrofobisiteit en molekulêre grootteveranderinge baie meer gereeld as dié met min verandering betrokke, en swaar redigering het proteïenhidrofobisiteit eenvormig verhoog (Figure 1, 2). Trouens, daar was 'n opvallende gebrek aan sterk geredigeerde kodons wat translasie stil was of betrokke was by min verandering van hidrofobisiteit en molekulêre grootte. Laastens het redigering meer gereeld plaasgevind in selektief-beperkte gene wat vir membraangebonde proteïene kodeer as dié wat vir oplosbares kodeer omdat hierdie gene baie U-ryke kodons bevat het wat hidrofobiese aminosure kodeer (Figure 4, 5, 6). Hierdie data ondersteun almal 'n rol van natuurlike seleksie in die vasstelling van mutasies by bewerkbare plekke en is fundamenteel onversoenbaar met 'n neutralistiese verduideliking wat genetiese drywing oproep.

Een punt wat ons wil uitklaar is dat die presiese twispunt in ons uiteensetting effens verskil van dié van [24]. Ons argument is breër as hulle s'n deurdat ons argumenteer dat beide fiksasie van redigeerwebwerwe en fiksasie van mutasies by redigeerbare terreine deur natuurlike seleksie bereik is. Teoreties kan enige werf met T of C na die oorsprong van redigeeraktiwiteit muteer na C of T (dws enige werf met T of C kan in die kategorie van "redigeerbare werwe val") aangesien dit altyd na sy oorspronklike toestand kan terugkeer na redigering of omgekeerde redigering. In werklikheid kan slegs sommige webwerwe toegelaat word om dit te doen, aangesien daar volgordemotiewe betrokke kan wees by die regstelling van redigeringswebwerwe soos voorgestel deur sommige outeurs [8, 11, 32].

Basies het die voorkoms van die redigeermasjinerie seleksiedruk op T↔C-mutasies verslap. Die data oor verspreiding van redigeerplekke tussen kodonposisies, kodons en gene soos ons hierbo aangebied het, demonstreer duidelik dat fiksasie van redigeerplekke en fiksasie van mutasies by redigeerbare webwerwe 'n patroon van funksionele seleksie gevolg het.

Oorsprong van RNA redigering aktiwiteit

Dit is algemeen erken dat die oorsprong van gene wat kodeer vir ensieme wat betrokke is by RNA redigering 'n kritieke stap in die oorsprong van RNA redigering verteenwoordig [8, 24]. Tot op hede bly die biochemiese aard van die redigeermasjinerie swak gekarakteriseer, selfs al is 'n kerngeen wat kodeer vir 'n proteïen wat noodsaaklik is vir RNA redigering in chloroplaste geïdentifiseer in Arabidopsis onlangs [58].

Daar is ook voorgestel dat die redigeermasjinerie waarskynlik in vroeë landplante ontwikkel het [7, 9, 13, 26], en dat dieselfde masjinerie verantwoordelik kan wees vir redigering in beide organelle [7, 9]. Die fundamentele vraag in die hele verhaal van evolusie van RNA-redigering is of die oorsprong van die redigeermasjinerie bloot 'n historiese ongeluk was of dit 'n evolusionêre innovasie van noodsaaklikheid verteenwoordig het. Genetiese drywing is opgeroep vir hierdie gebeurtenis [24] in die lig van 'n gebrek aan uitgebreide data en enige ooglopende funksionele verduideliking. Met baie meer data en uitgebreide ontledings is ons geneig om hier 'n ander siening in te neem.

Alhoewel ons saamstem dat die oorsprong van RNA-redigeeraktiwiteit self duidelik 'n neutrale gebeurtenis is, stel ons voor dat dit 'n mate van fiksheid aan die organellêre genome kan verleen. Andersins is dit ondenkbaar dat so 'n mutasie vasgestel en dan in landplantorganelgenome in stand gehou sou word oor 'n verloop van evolusie van meer as vierhonderd miljoen jaar. Ons bied 'n hipotese hieronder.

One basic fact we want to point out is that editing allows a higher GC content in the genome, because forward editing permits fixation of C in the sense strand and G in the antisense strand, and genes in organellar genomes are distributed on both strands of a circular molecule. Perhaps there is an upper limit of AT% that is permitted in a genome and this upper limit may have promoted fixation of the genes encoding enzymes involved in RNA editing.

To strengthen this argument, we remind readers that the genetic code table and start and stop codons in this table mandate presence of all four nucleotides in a genome. Thus, AT content in any genome certainly cannot exceed 100%, and no genome consisted of less than all four nucleotides has ever been reported. Still, we acknowledge that a link between the base composition of a genome and RNA editing frequency is weak even though the two phenomena are compatible. Further, reverse editing, which occurs frequently in the chloroplast genome of A. formosae, and is correlated strongly with the frequency of forward editing (Additional file 1), poses a problem to our explanation. However, if organellar genomes were under pressure, not only to reduce AT, but also to equilibrate the overall nucleotide composition under the second parity rule [56], then a reduction of T would also reduce A, and an increase in C would likewise increase G. Figure 7 shows the dramatic convergence of nucleotide composition toward the equilibrium value (25%) during the early evolution of land plants. This pattern is observed both at whole genome level and across conserved protein-coding genes in both mitochondria and chloroplasts, and may signify a 'drive' for convergence of the four nucleotides toward the equilibrium (Figure 7, Additional file 3). One extreme example of nucleotide convergence can be observed in the chloroplast genome of the lycophyte Selaginella uncinata (Figure 7a, c) [59], in which C→U editing affects

5% of the total coding region (S. Tsuji, pers. comm.).

Nucleotide frequencies across streptophytes for whole genomes of chloroplasts (a) and mitochondria (b), and combined codon positions for the conserved proteomes of chloroplasts (c) (57 genes) and mitochondria (d) (13 genes). Nucleotides are represented by filled circles for T, open circles for A, open triangles for G, and filled triangles for C. The convergence of nucleotide composition can be observed across whole genomes and conserved proteomes. Taxa with available RNA editing data are duplicated and designated as "edit-repaired" by an asterisk. Taxa are arranged according to a phylogenetic sequence of [46] and divergence times are not considered. Broad taxonomic groupings are indicated on the X-axis below brackets. Taxonomic abbreviations are described in Additional file 3.

The most difficult part of the RNA editing story to explain is the lineage-specific occurrence of a good number of editing sites, as many of them seem to have evolved rather recently [7, 13, 26, this study]. Colonization of land by charophytic algal ancestors of land plants, life history characteristics of individual species, the evolutionary history of particular lineages, lineage-specific GC contents in organellar genomes, different substitution rates in chloroplast and mitochondrial genomes of some plants, different degrees of asymmetrical distribution of genes on two strands in the circular organellar genomes, DNA polymerase infidelity and dNTP pool imbalances, and varying intragenomic rearrangement rates in different plant lineages may have all or partly contributed to the origin of editing activity. Especially, the first three processes could result in species undergoing bottleneck periods during which genetic drift could play a large role in fixing random mutations. However, explicit data are needed to tie any of these factors to evolution of RNA editing before a hypothesis favoring any one of them can be seriously entertained.


Gevolgtrekkings

GetOrganelle is a fast and versatile toolkit for de novo assembly of complete and accurate organelle genomes using low coverage WGS data. Our evaluations show that the GetOrganelle toolkit can efficiently and accurately assemble different types of organelle genomes from a broad range of organisms. In general, compared with NOVOPlasty, GetOrganelle has far better success rates for assembling plastomes while consuming similar or even less computational resources. Additionally, GetOrganelle-reassembled plastomes generally have much higher accuracy than those reassembled by NOVOPlasty or published ones that were assembled by various tools in accordance with the read mapping evaluation. GetOrganelle can also generate all possible configurations when plastomes or mitogenomes have flip-flop configurations or other isomers mediated by repeats.

Potential applications of GetOrganelle include quickly extracting organelle genomes from whole genome assemblies and evaluating organelle genome quality. Assembling organelle genomes from metagenomic data would also be possible by using a customized database and scheme. The maximum extending length option enables rough control of the length of the target assembly, which could be used to quickly assemble interesting loci or genes from the metagenomic and transcriptomic data. Additionally, the Python Classes and Functions defined in GetOrganelleLib could be used to manipulate and disentangle non-organelle assembly graphs.

Currently, GetOrganelle exports all possible configurations without using library information of the paired-end reads. However, the long insert size library or long-read sequencing data can be used for repeat resolution and configuration verification. A function that could use this information and estimate the proportion of all the potential isomers (configurations) is expected in a future version of GetOrganelle. Improvements in the seed databases and the label databases are also expected, which should result in better parameter estimation and higher success rates in assembling mitogenomes.


Erkennings

We thank Sudarshan Pinglay, and members of the Ehrenreich lab for helpful input regarding this manuscript. I.M.E. also thanks to the JCVI Synthetic Biology and Bioenergy Minimal Cell team, in particular Dan Gibson, Clyde Hutchison III, John Glass, Chuck Merryman, Hamilton Smith, Yo Suzuki, and Kim Wise, for a sabbatical that motivated this paper. This paper was supported by grant R35GM130381 from the National Institutes of Health (I.M.E.), funds from the University of Southern California (I.M.E.), and National Institutes of Health Chemistry–Biology Interface training grant fellowship (T32GM118289 C.B.H.).


Present address: Biomacromolecules Research Team, RIKEN Center for Sustainable Resource Science, Saitama, Japan

These authors contributed equally: Masaki Odahara, Kensuke Nakamura.

Affiliasies

Department of Life Science, Rikkyo (St. Paul’s) University, Tokyo, Japan

Masaki Odahara & Yasuhiko Sekine

Department of Life Science and Informatics, Maebashi Institute of Technology, Gunma, Japan

Department of Biotechnology, Toyama Prefectural University, Toyama, Japan

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Jy kan ook vir hierdie skrywer soek in PubMed Google Scholar

Bydraes

M.O., K.N. and T.O. performed experiments, M.O., K.N., Y.S. and T.O. analyzed data, and M.O., K.N. and T.O. die vraestel geskryf.

Ooreenstemmende skrywers


Kyk die video: Organelle genome (September 2022).