Inligting

Watter sagteware het ek nodig om te lees-skryf cas9? en .dna-lêers?

Watter sagteware het ek nodig om te lees-skryf cas9? en .dna-lêers?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ek is nog steeds 'n volledige beginner vir crispr en ek probeer steeds leer wat dit is en hoe om dit werklik te gebruik. Ek besef nou dat jy die crispr-komponente moet bestel nadat jy dit eintlik self ontwerp het in sagteware waarmee jy die komponente kan ontwerp en verander.

Is ek sover reg?

Ek wonder of iemand my kan help om te vind watter sagteware ek moet gebruik om .dna-lêers te ontwerp en of te verander. Verkieslik gratis en oopbronsagteware. Is daar enige goeie tutoriale vir iemand wat meer in crispr wil raak?


Jy het 'n lang reis wat voorlê. Hierdie ou het omtrent 4 jaar spandeer om te leer wat hy hier doen.

Hy gebruik Snapgene-sagteware


Induksie van geteikende, oorerflike mutasies in gars en Brassica oleracea met behulp van RNA-geleide Cas9 nuklease

Die RNA-geleide Cas9-stelsel verteenwoordig 'n buigsame benadering vir genoomredigering in plante. Hierdie metode kan spesifieke mutasies skep wat teikengeenfunksie uitskakel of verander. Dit bied 'n waardevolle hulpmiddel vir plantnavorsing en bied geleenthede vir oesverbetering.

Resultate

Ons ondersoek die gebruik en teikenspesifisiteitsvereistes van RNA-geleide Cas9 genoom redigering in gars (Hordeum vulgare) en Brassica oleracea deur multikopie-gene te teiken. In gars teiken ons twee kopieë van HvPM19 en Cas9-geïnduseerde mutasies in die eerste generasie van onderskeidelik 23 % en 10 % van die lyne waarneem. In B. oleracea, teiken van BolC.GA4.a lei tot Cas9-geïnduseerde mutasies in 10 % van eerste generasie plante wat gekeur is. Daarbenewens identifiseer 'n fenotipiese skerm T0 plante met die verwagte dwerg-fenotipe wat geassosieer word met uitklop van die teikengeen. In beide gars en B. oleracea stabiele Cas9-geïnduseerde mutasies word na T oorgedra2 plante onafhanklik van die T-DNA-konstruk. Ons neem buite-teikenaktiwiteit in beide spesies waar, ten spyte van die teenwoordigheid van ten minste een wanpassing tussen die enkelgids-RNA en die nie-teikengeenvolgordes. In gars het 'n transgeenvrye plant gelyktydige mutasies in die teiken- en nie-teikenkopieë van HvPM19.

Gevolgtrekkings

Ons demonstreer die gebruik van RNA-geleide Cas9 om mutasies te genereer in teikengene van beide gars en B. oleracea en toon stabiele oordrag van hierdie mutasies wat dus die potensiaal vir vinnige karakterisering van geenfunksie in hierdie spesies vestig. Daarbenewens bied die buite-teiken-effekte wat gerapporteer word beide potensiële probleme en spesifieke geleenthede om lede van multigeenfamilies in gewasse te teiken.


Inleiding

DNA-metilering speel 'n belangrike rol in normale ontwikkeling en die wanregulering daarvan word geassosieer met veelvuldige siektes, insluitend kanker 1,2,3. Alhoewel hoë promotor-DNA-metilering vermoedelik met lae geenuitdrukking geassosieer word, het onlangs beskikbare heelgenoommetielome en -transkripome DNA-metilering in ander aktiwiteite geïmpliseer, soos die beheer van transkripsiefaktorbinding en voorheen duidelike korrelasies tussen DNA-metilering en geenuitdrukking het 4,5 . Die onvermoë om presies te beheer De novo DNA-metilering in soogdierselle belemmer ons begrip van hoe DNA-metilering by verskillende terreine stroomaf-effekte beheer. Onlangse pogings in grootskaalse projekte soos die ENCODE 6 en die Roadmap Epigenomics Projects 7 het die identifikasie van talle weefsel- en siektespesifieke veranderinge in menslike epigenetiese landskappe moontlik gemaak, maar hoe DNA-metilering spesifiek geenuitdrukking tydens ontwikkeling en siekte-progressie reguleer onduidelik. Huidige metodes om DNA-metilering te manipuleer is hoofsaaklik gebaseer op globale inhibisie van DNA-metieltransferases via klein molekule verbindings (byvoorbeeld hipometilerende middels soos Azacitidine en Decitabine), wat breë epigenetiese veranderinge en aktivering van endogene retrovirusse veroorsaak 8,9,10. ’n Gebrek aan tegnologieë vir geteikende manipulasie van DNA-metilering het studie van die korrelasie tussen lokusspesifieke DNA-metilering en geenuitdrukking belemmer. Die generering van 'n maklik benaderde DNA-metieltransferase het potensiële nut om die rol van DNA-metilering in veelvuldige biologiese prosesse te dissekteer.

Fusieproteïene wat bestaan ​​uit eukariotiese DNA-metieltransferases of hidroksimetileringsensieme en DNA-bindende proteïene, soos sinkvingerproteïene en transkripsie-aktivator-agtige effektors, is gerapporteer om geteikende DNA-modifikasie 11,12,13 te produseer. Beide sinkvingerproteïene en transkripsie-aktivator-agtige effektor-gebaseerde DNA-metieltransferase-stelsels vereis egter individuele ontwerp en die konstruksie van enkoderende plasmiede is arbeidsintensief. In vergelyking met hierdie baanbrekerswerktuie, het CRISPR 'n unieke voordeel in multipleks lokus ingenieurswese en toon 'n weglaatbare impak op gemetileerde DNA 14,15. dCas9 as 'n nuwe DNA-bindingsplatform is toegepas om geteikende transkripsionele herprogrammering, histoon-asetilering en ander biologiese funksies 16,17,18 te bestudeer. Drie onlangse pogings 19,20,21 om te versmelt met dCas9 die soogdier De novo DNA-metieltransferase 3A (DNMT3A), hetsy volle lengte of die katalitiese domein (CD), het doeltreffende geteikende DNA-metilering getoon, maar het oor die algemeen 'n lang inkubasie ('n paar dae) in selle vereis om piekdoeltreffendheid te bereik, wat hierdie instrumente moontlik beperk het van kontekste waar vinnige effekte word benodig.

Hier het ons 'n ander benadering gesoek, deur 'n heteroloë DNA-metieltransferase na dCas9 te benut. Alhoewel baie verskillende prokariotiese DNA-metieltransferases geïdentifiseer is, metileer slegs 'n paar uitsluitlik CpG-dinukleotiede. Ons het gefokus op een wat afgelei is van Mollicutes spiroplasma (M. Sss1), stam MQ1, wat goed gekarakteriseer is 22 . In die besonder, MQ1 DNA-metieltransferase (hierna 'MQ1' genoem) is klein (386 aminosure) en funksioneer as 'n hoogs doeltreffende De novo DNA-metieltransferase, wat dit 'n aantreklike kandidaat maak vir aanpassing by soogdierselle 22,23.

In hierdie studie versmelt ons dCas9 met die MQ1 om geteikende DNA-metilering in menslike selle uit te voer. Om MQ1 beter te beheer, genereer ons 'n mutantvorm, dCas9-MQ1 Q147L , wat in staat is om vinnig (binne 24 uur) en doeltreffend DNS-metilering te teiken sonder ooglopende buite-teiken-effekte. Ons wys verder dat geteikende DNA-metilering CCCTC-bindingsfaktor (CTCF) bindings in menslike selle verander. Ten slotte demonstreer ons dat ons instrument van toepassing is om spesifiek DNA-metilering in muisembrio's te wysig via sigootmikro-inspuiting.


TrueCut Cas9 Proteïenprodukte

Kies die regte Cas9 vir jou spesifieke genoomredigeringsbehoeftes—van basiese navorsing tot prekliniese navorsing en prosesontwikkeling. Maak nie saak wat jy kies nie, albei weergawes bied uitstekende werkverrigting en waarde.

Invitrogen TrueCut Cas9 Proteïen v2

  • Konsekwente hoë werkverrigting in alle getoetsde sellyne insluitend standaard, primêre, stam en immuun (>90% redigering in T-selle).
  • Tot 2X hoër redigeerdoeltreffendheid in moeilike teikens as die kompetisie
  • Hoë kwaliteit: vervaardig volgens streng ISO 13485 kwaliteitstandaarde

Gibco TrueCut Cas9 Proteïen (CTS-prototipe)

  • Konsekwente hoë werkverrigting in alle getoetsde sellyne (>90% redigering in T-selle).
  • Hoër streng vervaardiging in ooreenstemming met standaarde vir aanvullende materiale vir sel- en weefselgebaseerde produkte, insluitend USP <1043>, Ph.Eur. 5.2.12, en ISO 20399 -1, -2, -3, volgens die beginsels van 21 CFR Deel 820 in 'n FDA-geregistreerde vervaardigingswerf.
  • Naspeurbaarheidsdokumentasie en uitgebreide veiligheidstoetse, insluitend biolas, endotoksien, mikoplasma, oorblywende gasheernukleïensure en proteïen
  • Aseptiese vervaardiging met behulp van eenmalige tegnologie
  • Steriele vulsel in 'n Klas A/B skoonkamer
  • Groot pakgroottes: 2,5 en 5,0 mg teen 'n 10 mg/ml konsentrasie

BESPREKING

In die huidige studie beskryf ons 'n metodologie en ooreenstemmende gereedskapstel wat voorsiening maak vir vinnige en maklike genetiese modifikasie vir stam-ingenieurswese in S. cerevisiae. Ons bied 'n uitgebreide integrasie plasmied biblioteek wat voorsiening maak vir hoë-doeltreffendheid integrasie in 23 gekenmerk genomiese lokusse, waarvan baie voorsiening maak vir integrasie doeltreffendheid bo 95% (Figuur 2C). In vivo samestelling van sgRNA's in Cas9-plasmiede het integrasietempo's net onder dié van voorafgekloonde plasmiede gebied, wat gebruikers in staat stel om maklik hul eie integrasieterreine te kies sonder die behoefte aan kloning (Aanvullende Figuur S4).

In ons werk het die meeste integrasiewebwerwe tot soortgelyke GFP-uitdrukkingsvlakke gelei, met slegs 'n ~2-voudige reeks in proteïenuitdrukking (soos gemeet deur fluoressensie, Figuur 2B), in ooreenstemming met 'n onlangse verslag wat 11 integrasielokusse (48) ondersoek. 'n Vorige studie wat verslaggewerproteïenkassette ondersoek wat by verskeie chromosomale terreine geïntegreer is, rapporteer 'n effens groter (~10-voudige) reeks in uitdrukkingsvlak met behulp van 'n toets gebaseer op β-galaktosidase-aktiwiteit (23). Ander onlangse verslae neem waar dat lokus-effekte oorgedra word na verskillende uitdrukkingskassette, met die lokus wat verantwoordelik is vir 35% (soos gemeet deur qRT-PCR) of 90% (soos gemeet deur fluoressensie) van veranderinge in waargenome uitdrukking, wat ons bevindings veralgemeenbaar maak vir ander heteroloë gene (24, 49). Die verskille in waargenome uitdrukkingsvlak van die verslaggewerproteïen kan verantwoord word deur die verskillende metodes van analise wat in hierdie studies gebruik word, sowel as die keuse van terreine binne 'n individuele studie (bv. intergenies versus intragenies), wat die behoefte beklemtoon om gestandaardiseerde metingseenhede te gebruik om uitdrukking te kwantifiseer, soos ons gedoen het.

Terwyl die meerderheid van die sgRNA's in ons pCut-biblioteek aanvanklik hoë-doeltreffendheid-integrasies tot gevolg gehad het (Figuur 2C), het die verwydering van die ribosiemstruktuur vanaf die sgRNA 'n dramaties verhoogde tempo van integrasie vir een van die lae-doeltreffendheid-terreine tot gevolg gehad (805a, Aanv. Figuur S3). Daarbenewens het twee ander sgRNA's gelei tot lae integrasiekoerse met of sonder die ribosiem (1206a en 607c). 'n Vorige studie het die chromosomale landskap van nukleosoomafhanklike geenuitdrukking in gis ondersoek deur 'n histoonuitputtingstoets te gebruik, en uitdrukkingsveranderinge vir elke geen na-uitputting in kaart gebring (50). Ons het die landskap vir elkeen van ons mislukte snyplekke ondersoek en gevind dat 1206a meer as 5 kb weg is van enige hipotese heterochromatiese gebied, terwyl 607c in 'n gebied van geen-opregulering lê na uitputting. Hierdie resultate dui daarop dat die 607c sgRNA moontlik nie funksioneer nie omdat dit nie toegang tot die DNA het as gevolg van heterochromatiese struktuur nie, terwyl 1206a vou of ander probleme met die sgRNA self kan hê.

Nietemin moet duidelik faktore buite-teiken-effekte oorweeg word vir optimale sgRNA-ontwerp, soos sgRNA-vou, transkripsie en degradasie, wat uitstekende onderwerpe vir toekomstige ondersoek is. Verder vereis die impak van lokuskenmerke soos chromatienstruktuur op die doeltreffendheid van genomiese integrasie (51) deur potensieel toeganklikheid tot die sgRNA-Cas9p-kompleks en HR-herstelmasjinerie te beïnvloed, verdere navorsing en toeligting.

Hierdie studie is die eerste om temporele resolusie van dele-aktiwiteit oor verskillende toestande op 'n sistematiese wyse te integreer. Baie van chemiese produksie (veral tydens bondelfermentasie) vind plaas in stilstaande fase waar daar min tot geen karakterisering van promotors en ander uitdrukkingsdele is nie. Omdat ons verskeie groeifases en media getoets het, het ons ondersoek tot verskeie nuwe bevindings gelei. Terwyl PGAL1 word beskou as een van die promotors wat die hoogste uitdrukking in S. cerevisiae, sy aktiwiteit daal aansienlik in later stadiums van groei (Tabel 1). Met behulp van 'n GFP-verslaggewerkasset het ons ses promotors geïdentifiseer wat gelei het tot fluoressensievlakke hoër as dié van PGAL1 in stilstaande fase (PHSP26, PSSA1, PPCK1, PHSP82, PHSP104, PADH2). Van besondere belang is PHSP26, wat skaars aktief in eksponensiële selle is, bereik nog onder die hoogste uitdrukkingsvlakke van enige toestand by stilstaande fase. Groeifase-spesifieke aktiwiteit kan wenslik wees in sekere sintetiese biologie ontwerpe, insluitend strategieë vir groei-ontkoppelde stasionêre fase produksie, of tydelike skei ensiem aktiwiteite wat onversoenbaar is.

Daarbenewens het ons verskeie ander hoë-sterkte promotors geïdentifiseer wat nie in ander studies ondersoek is nie, insluitend PENO2, PRPL3, PTPI1 en PYEF3, sowel as verskeie stasionêre fase-geïnduseerde promotors (PHSP26, PSSA1, PPCK1, PHSP82, PHSP104 en PADH2). 'n Handvol van die promotors wat vir hierdie studie gekies is, is ook in 'n eksponensiële fase in 'n ander onlangse ondersoek getoets en het dieselfde rangorde in proteïenuitdrukkingsterkte (PTDH3, PCCW12, PTEF1, PTEF2, PPGK1, PHHF2, PHHF1) soos bepaal deur fluoressensie (31).

Die gereedskapstel wat in hierdie werk beskryf word, bied 'n vinnige benadering om veelvuldige geenuitdrukkingskontekste gelyktydig te ondersoek, en verhoog dus die kanse om aktiwiteit te verbeter selfs in die afwesigheid van volledige biologiese begrip. Om die nut daarvan te demonstreer, het ons hierdie konteks-diversiteitsbenadering toegepas om swak aktiwiteit vir die ensiem TXS te diagnoseer en aan te spreek (Figuur 5A). Gis-TXS-aktiwiteit is veral wenslik aangesien baie van die paclitaxel-wegstappe stroomaf van TXS sitochroom P450's behels, wat berug moeilik is om uit te druk in E coli. Deur ons gereedskapstel te gebruik, kon ons wys dat proteïenoplosbaarheid beperkend was vir TXS-aktiwiteit in gis (Figuur 5). Deur TXS-MBP-fusieproteïene te konstrueer, het ons 'n 25-voudige verbetering in taksadieentiter behaal. MBP-etikette is voorheen in gis gebruik vir affiniteitsuiwering, maar dit is die eerste studie wat toon dat die MBP-etiket ook gebruik kan word om proteïenoplosbaarheid in S. cerevisiae. 'n Soortgelyke metodologie kan help om ander beperkende parameters soos swak intrasellulêre lokalisering of proteïenafbraak vir ander ensieme te identifiseer en op te los, en 'n veralgemeende benadering wees om uitdrukkingskontekste van heteroloë ensieme te optimaliseer.


Resultate en bespreking

'n Gepoelde CRISPR/Cas9-skerm vir validering van CLD

Om die funksionaliteit van CLD te toets, het ons 'n pasgemaakte, ultra-komplekse biblioteek ontwerp en dit in 'n saamgevoegde skerm in menslike kankerselle getoets (rou data word verskaf in Addisionele lêer 5: Tabel S4, Addisionele lêer 6: Tabel S5, Addisionele lêer 7 : Tabel S6, Addisionele lêer 8: Tabel S7). Ons het gekies om te kyk vir modulators van TRAIL-geïnduseerde apoptose, aangesien uitputting van TRAIL-wegkomponente verskillende pro- of anti-apoptotiese fenotipes tot gevolg het [32]. Ons pasgemaakte biblioteek was saamgestel uit 12471 sgRNA's wat 408 gene teiken en insluitend 200 nie-teiken, ewekansig ontwerpte kontrole sgRNA's (Bykomende lêer 3: Figuur S3, Addisionele lêer 9: Tabel S8). Ons het positiewe ingesluit (bv. CASP8, BAX, FADD) en negatiewe reguleerders (bv. BCL2L1) van die TRAIL-pad, tesame met 'n groot aantal menslike proteïenkinases (Bykomende lêer 2: Tabel S2). Elke geen is geteiken deur 30 verskillende sgRNA's. Die gene BAX, CASP8, en FADD gedien as positiewe kontroles en is geteiken met ongeveer 100 sgRNA's. SW480-selle wat Cas9 stabiel uitdruk, is met die lentivirale sgRNA-biblioteek oorgedra. Die poel van mutante selle is behandel met óf rekombinante TRAIL óf fosfaat gebufferde soutoplossing (PBS) (Fig. 2a). Die resultate van die skerm het getoon dat sgRNA's van spesifieke gene verryk of uitgeput is tydens TRAIL-behandeling, insluitend bekende positiewe (bv. CASP8, BAX, FADD) en negatiewe reguleerders (bv. XIAP, BCL2L1) (Fig. 2e, f Addisionele lêer 3: Figuur S2). Noodsaaklike komponente van die pad, soos CASP8 of FADD, het 'n gemiddelde verryking van ongeveer viervoudig getoon in vergelyking met nie-teikenkontroles (bl < 10 -3, Wilcoxon rangsomtoets) (Fig. 2d). Die reseptore vir TRAIL-ligande (TNFRSF10A/DR4, TNFRSF10B/DR5), wat gedeeltelik oortollig is [33], het 'n swakker verryking getoon (Bykomende lêer 3: Figuur S2a-c). sgRNAs teen bekende negatiewe reguleerders van die pad word uitgeput met 'n gemiddelde vou verandering van

2 (Fig. 2b, c Addisionele lêer 3: Figuur S2e, f). Willekeurige, nie-teiken sgRNAs het 'n mediaan log getoon2 vou verandering rondom 0 (Fig. 2b–d Addisionele lêer 3: Figuur S3). Die vouverandering van elke sgRNA-teiken CASP8, FADD, en BAX in die TRAIL-behandeling versus kontrolegroep word in Fig. 2e–g getoon. Vir hierdie gene is meer as 80 % van sgRNA's verryk na blootstelling aan TRAIL. Vir ander treffers het meer as twee derdes van alle sgRNA's 'n verwagte fenotipe getoon (Bykomende lêer 3: Figuur S2), wat aandui dat 'n hoë fraksie van sgRNA's wat deur CLD ontwerp is, wel funksioneel is.

'n Gepoelde skerm vir funksionele validering van CLD. a Die siftingstrategie in SW480-selle. Kortliks, 'n poel van mutante SW480-selle wat 12,471 sgRNA-ontwerpe teen 408 gene bevat, is gegenereer deur lentivirale infeksie en antibiotika seleksie. Veertien miljoen selle per toestand is dan vir 'n totaal van 12 dae met PBS (kontrole) of rekombinante TRAIL (behandeling) behandel. Vervolgens is die genomiese DNA van die monsters onttrek en sgRNA samestelling ontleed deur volgende generasie volgordebepaling (NGS). b Vergelyking van sgRNA-volgordetellings tussen twee biologiese replikate demonstreer hoë reproduceerbaarheid (Pearson-korrelasiekoëffisiënt

0.79). c Verspreiding van sgRNA's gerig op positiewe padreguleerders (CASP8, CASP3, FADD, BAX, BID, TNFRSF10A, TNFRSF10B) in rooi, negatiewe reguleerders (XIAP, BCL2L1) in blou, en ewekansige, nie-teiken sgRNA's in oranje tussen TRAIL (y-as) en PBS (x-as) behandelde selpopulasies. d Strooidiagram wat relatiewe verryking van gene toon (y-as) met hul ooreenstemmende bl waarde (x-as). Positiewe reguleerders word ingeteken rooi, negatiewe reguleerders in blou, en ewekansige, nie-teiken sgRNA's in oranje. P waardes is bereken deur Wilcoxon rangsom toets tussen 30 sgRNAs van een geen en 200 ewekansige, nie-teiken sgRNAs. Meld2 vou verandering word as mediaan log bereken2 verhouding tussen genormaliseerde sgRNA-telling van TRAIL- oor PBS-behandelde populasies. Die vertikale lyn punte a bl waarde van 0,05. eg Mediaan genormaliseerde vouverandering van alle sgRNA's wat drie noodsaaklike TRAIL-wegkomponente teiken. 'n Totaal van 100 sgRNA's word vir elke geen uitgebeeld. Verrykte sgRNA's word ingekleur rooi, uitgeputte sgRNA's in grys. Die stippel lyn verteenwoordig die mediaan vou verandering van alle sgRNA's van die ooreenstemmende geen

Ontwerpparameters vir sgRNA-biblioteek

Seleksie van sgRNA's met 'n hoë doeltreffendheid op teiken kan die kompleksiteit van saamgevoegde biblioteke verminder en sifting vergemaklik. Om parameters te verstaan ​​wat doeltreffendheid op die teiken bepaal, is dus noodsaaklik vir optimale biblioteekontwerp. Die resultate van ons skerm wys dat die funksionele impak van individuele sgRNA afhanklik is van die ekson wat geteiken word. Met behulp van CASP8 as 'n voorbeeld, demonstreer ons dat sgRNA's wat die eerste ekson teiken minder verryk is as dié wat ander eksons teiken (Fig. 3a, b) bl < 0,05, tweesydig t-toets). Dit kan verklaar word deur die geenmodel van CASP8: terwyl die eerste ekson deur slegs min transkripsievariante gebruik word, word belangrike funksionele domeine deur verskeie eksons geënkodeer [34]. Daarbenewens is gevind dat nukleotiedsamestelling rondom die PAM op-teikenaktiwiteit van sgRNAs bepaal [12, 13, 35]. Die netto effek van spesifieke nukleotied kenmerke word opgesom deur twee gepubliseerde algoritmes [30, 31]. Om die voorspellende krag van hierdie algoritmes te bepaal, het ons die doeltreffendheid van individuele sgRNA's van FADD, BAX, en CASP8 deur hul vouverandering te vergelyk met die gemiddelde vouverandering van alle sgRNA's van hierdie gene. sgRNA's met 'n z-telling >1 is as funksioneel geklassifiseer en dié met 'n z-telling < -1 is as nie-funksioneel beskou. Ons het toe die twee groepe vergelyk met betrekking tot die puntealgoritme gepubliseer deur Doench et al. (Doench-telling) en Xu et al. (Xu-telling) deur 'n paar t-toets. Ons wys dat die Doench-telling betekenisvol verskil tussen die groepe (Fig. 3c), terwyl geen verskil vir die Xu-telling gevind is nie (data nie getoon nie). Ons data bevestig dat die keuse van sgRNA's met 'n hoë Doench-telling die algehele prestasie van sgRNA-biblioteke kan verhoog. Die aantal sgRNA's met 'n hoë Doench-telling is egter beperk (Bykomende lêer 3: Figuur S4). Benewens doeltreffendheid op teiken, word die werkverrigting van sgRNA-biblioteke ook bepaal deur die spesifisiteit van geselekteerde sgRNA's. Soos getoon in Fig. 3d, sgRNAs met geen of min voorspelde off-teikens is skaars op 'n genoom skaal, soos bereken met behulp van bowtie. Verder verskil die frekwensie van potensiële buite-teikens aansienlik tussen verskillende organismes (Bykomende lêer 3: Figuur S5).

Impak van sgRNA-kenmerke op biblioteekontwerp. a Strooidiagram wat log2 vou verandering van sgRNA's teiken wys CASP8 relatief tot hul ekson-ligging. Die geenmodelle van hooftranskripsies van CASP8 word uitgebeeld (ENST00000432109, ENST00000392258, ENST00000323492, ENST00000264275, ENST00000358485). b Boksplotte wat vouverandering toon van alle sgRNA's wat die eerste ekson van CASP8 in vergelyking met ander geteikende eksons. sgRNA's teen die eerste ekson is minder verryk (*bl ≤ 0,05, tweesydig t-toets). c Vergelyking van sgRNA kenmerke tussen funksionele en nie-funksionele sgRNA's. Alle sgRNA's van BAX, FADD, en CASP8 is gekies vir ontleding. Vou veranderinge van individuele sgRNAs van elke geen is vergelyk met die gemiddelde vou verandering van alle sgRNAs van die onderskeie gene. sgRNA's met 'n z-telling >1 is as funksioneel gegroepeer en dié met 'n z-telling < -1 is as nie-funksioneel gegroepeer. Die op-teiken telling deur Doench et al. is vir beide groepe bereken (y-as) en word as bokserwe aangebied. Verskille tussen groepe is bepaal deur 'n tweesydige t-toets. d Lyngrafiek wat interafhanklikheid tussen aantal teikenbare menslike proteïenkoderende gene toon (y-as), sgRNA dekking per geen (x-as), en aantal buite-teikens (gekleurde lyne). Buite-teikens word gedefinieer as genomiese streke met ten minste 12 basisse van homologie met die protospacer van die op-teiken

Beperkings van in silico-biblioteekontwerp

Saamgevat verskaf ons eksperimentele bewyse dat die algoritmes wat in CLD geïmplementeer is, nukleotiedvolgorde met hoë sgRNA-aktiwiteit betroubaar kan identifiseer. Met behulp van CASP8 as 'n geval voorbeeld (Fig. 3a, b), bevestig ons ook vorige bevindinge dat sgRNA's wat funksionele domeine en algemene eksons teiken meer waarskynlik sal lei tot verlies van funksie [11]. CLD se vermoë om toepaslike teikenterreine te kies is egter afhanklik van die kwaliteit van genoomaantekeninge. Terwyl proteïen-koderende transkripsies van gevestigde model-organismes en die menslike genoom goed geannoteer is, is dit nie die geval vir nie-koderende transkripsies of die koderende genome van baie ander spesies nie, wat kan lei tot 'n groter fraksie van nie-funksionele sgRNA's. Daarbenewens word buite-teikens voorspel deur CLD gebaseer op volgorde homologie [27]. Dit beperk nie-teiken opsporing tot terreine met soortgelyke rye (wat tot drie wanpassings toelaat). Potensiële buite-teikens by plekke met laer homologie kan onopgemerk bly [36, 37]. Verder kan die sensitiwiteit vir die opsporing van buite-teikenterreine wissel na gelang van die algoritme wat gebruik word (bowtie versus blast). Die koers van buite-teikens kan dus deur CLD onderskat word wanneer strikdas as die belyningsopsie gekies word. Ons wys ook dat sgRNA's met 'n hoë doeltreffendheid en/of spesifisiteit skaars is op genomiese vlak en ongelyk tussen gene versprei is, deels as gevolg van verskille in geen-model lengte (Bykomende lêer 3: Figuur S1). Verder is huidige kennis oor doeltreffendheid op die teiken in wese afgelei van studies in muriene en menslike sellyne en dit is nie bekend of dit ook op ander organismes van toepassing is nie. Daarom sal die ontwerp van omvattende biblioteke noodwendig sgRNA's insluit met minder voorspelbare doeltreffendheid op die teiken en veelvuldige buite-teikens. Verder kan bykomende parameters wat nie berekenbaar voorspel kan word nie, veranderlikheid in die werkverrigting van CRISPR/Cas9-skerms inbring. Dit sluit sellynspesifieke kenmerke in soos gebrekkige wanpasherstelstelsel, mutasies/genetiese variante [38], en verskille in DNS-toeganklikheid tot Cas9 [39, 40]. Daarbenewens, terwyl sifting vir proteïene wat noodsaaklik is vir virale of toksieninskrywing slegs min treffers met hoogs penetrerende fenotipes oplewer [10], sal ontstellende komplekse seinnetwerke vir geneesmiddelweerstandontdekking heel waarskynlik minder duidelike treffers openbaar. Hierdie nadele kan gedeeltelik oorkom word deur sifting met gefokusde biblioteke met hoër kompleksiteit, soos getoon is vir klein haarnaald-RNA-skerms [41]. Alhoewel funksionele uitputting van proteïenkoderende gene deur saamgevoegde CRISPR/Cas9-skerms hoogs doeltreffend is, vereis die teiken van nie-koderende gene alternatiewe strategieë en biblioteekontwerpe. 'N Potensiële benadering om die funksie van versterkers te dissekteer is die gebruik van versadigende mutagenese, dit wil sê om spesifieke streke te rig met soveel sgRNA's as moontlik [42, 43].


Metodes

Program oorsig

sgRNAcas9 (weergawe 2.0.6), 'n sagtewarepakket, bevat sewe Perl (Praktiese Onttrekking en Verslagtaal) skrifte en kan plaaslik in Windows, Linux en Mac OS X-stelsels (Lêer S1) loop. Hierdie perl-skrifte, wat elkeen verskillende take uitvoer, word soos volg gelys: (1) sgRNAcas9.pl (hoofskrif), (2) format_genome.pl, (3) ot2gtf.pl, (4) pot2gtf.pl, (5) check_sgRNA_seq .pl, (6) sgRPrimer.pl, en (7) extract_targetSeq.pl. SeqMap is 'n instrument wat groot hoeveelhede kort oligonukleotiede teen 'n baie hoë spoed na die genoom kan karteer, wat dit geskik maak vir gebruik as 'n buite-teiken voorspeller [30]. Hierin is SeqMap, wat as 'n genoomwye Cas9/sgRNA buite-teiken soekenjin gebruik word, reeds by die sgRNAcas9 sagteware pakket ingesluit. Die hoofstappe van die sgRNAcas9-werkvloei word in Figuur 1 getoon. Stap 1. Soek CRISPR-teikenwebwerwe. Stap 2. Evalueer buite-teiken-effekte. Stap 3. Kies die sgRNA uitdrukkingsvektor en ontwerp oligonukleotiede. Stap 4. Onttrek die verlangde lengte van nukleotiedvolgordes wat die op- of buite-teiken splitsingsplekke flankeer vir die ontwerp van PCR-primerpare om Cas9-endonuklease-splitsingsaktiwiteit te valideer. Stap 1 & 2 word uitgevoer deur script format_genome.pl, sgRNAcas9.pl, ot2gtf.pl, en pot2gtf.pl Stap 3 word uitgevoer deur check_sgRNA_seq.pl en sgRPrimer.pl Stap 4 word uitgevoer deur extract_targetSeq.pl.

Om CRISPR-teikenwebwerwe te vind en buite-teiken-risikobeoordeling sluit 4 basiese stappe in. Dit is opmerklik dat om buite-teiken-effekte presies te evalueer, verskillende tipes potensiële buite-teiken-splytingsplekke (POT) geklassifiseer word.

Vind CRISPR-teikenwebwerwe

Om CRISPR/Cas9-teikenwebwerwe te vind, word vier soekmodusse (sin-string-soek, anti-sin-string-soek, beide string-soek en gepaard-gRNA-soek) verskaf deur die sgRNAcas9.pl-program te gebruik (Figuur 2). Maak nie saak watter modus gebruik word nie, die soekpatroon van CRISPR-teikenwebwerwe word gestel as 5′-GGX18NGG-3′, 5′-GX19NGG-3′ of 5′-X20NGG-3′, waar N en X enige basis, NGG is is die PAM-volgorde. Die doel van “G” of “GG” ligging by 5′ is om te voldoen aan die vereiste dat sgRNA-volgordes met “G” moet begin om transkripsie-inisiasie te handhaaf, indien 'n U6 snRNA-promotor of T7-promotor gebruik word om 'n funksionele sgRNA uit te druk. Invoerreekse moet in FASTA-formaat voorsien word met 'n 5' tot 3' rigting. Enige volgorde wat as invoerlêer gegee word, sal in hierdie program as die "sinstring" genoem word. Sodra "beide string-soekmodus" of "gepaard-gRNA-soekmodus" gekies is, kan die volgorde deur die sgRNAcas9-program in sy omgekeerde-komplement-eweknie (anti-sense string) omgeskakel word. Genoom- en GTF-lêers kan afgelaai word vanaf Ensembl ftp-werf (http://www.ensembl.org/info/data/ftp/index.html) of NCBI-webwerf (ftp://ftp.ncbi.nlm.nih.gov/ genome/). Genoom-DNS-volgorde met FASTA-opskrifte moet vooraf deur script format_genome.pl behandel word voordat hoofprogram sgRNAcas9.pl uitgevoer word.

(A) Sien string-soekmodus (die rigting van ry is 5′ tot 3′). (B) Anti-sense string soekmodus (die rigting van volgorde is 3′ tot 5′). (C) Gepaarde-gRNA soekmodus. Notas: verskillende maniere van sgRNA-binding aan teiken-DNA-string word getoon. A en B is enkelstring-soekmodus, daar is ook 'n opsie om beide string-soekmodus te gebruik (nie gewys nie).

Vorige studies het getoon dat sgRNA-volgordes met baie hoë of lae GC-inhoud (%) minder effektief teen hul teikens is [31]. Om die splitsingsdoeltreffendheid van 'n spesifieke sgRNA te verhoog, moet GC-inhoud noukeurig oorweeg word. Om aan hierdie vraag te voldoen, is die waarde van GC-inhoud as 'n opsie-argument in die sgRNAcas9.pl-program gestel. 'n Standaardparameterwaarde word verskaf, met 'n GC-inhoudreeks van 20% tot 80% [31]. Interessante navorsing het getoon dat afgekapte sgRNA met komplementariteitslengtes van 17 of 18 nt gebruik kan word om spesifisiteit van CRISPR-Cas nuklease te verbeter [29]. Om aan hierdie vraag te voldoen, word lengtes van sgRNA as 'n opsionele argument in die sgRNAcas9.pl-program gestel, wat dit dus baie gerieflik maak vir die ontwerp van afgeknotte sgRNA. Dit is die moeite werd om te noem dat die beide string soek- en gepaarde-gRNA-soekmetodes verskil. Ten einde genoom-redigeringsspesifisiteit te verbeter, word hspCas9 D10A in kompleks met gepaarde gRNA gebruik om dubbele inkeping met 'n 5'-oorhang te genereer [3], [28]. Die gepaarde-gRNA-soekmodus word gebruik om die gebruiker te help met die selektering van sgRNA-pare met die maksimum doeltreffendheid van genoommodifikasie. Die teiken lokusse vir die sgRNA-pare moet met 'n optimale gaping verreken word. sgRNA offset word gedefinieer as die afstand tussen die PAM-distal (5′) einde van die gidsvolgorde van 'n gegewe sgRNA paar. Daarin word die opsionele argument gestel om die soektog na sgRNA-teikens met gebruikergedefinieerde waardes af te dwing. Standaardafsettings word ook verskaf, wat wissel van -2 tot 32 bp (basispare), om die akkuraatheid van teikenmodifikasie op grond van eksperimentele data te optimaliseer [28]. Tydens ons manuskrip se portuurbeoordeling het twee nuwe navorsingsverslae oor dimeriese CRISPR RNA-geleide FokI nukleases, wat afhanklik is van die binding van twee gids-RNA's aan DNA, is gepubliseer [32], [33]. Die opsionele argument wat ingestel is om te soek na gepaarde-gRNA is ook geskik vir die ontwerp van twee gids-RNA's met die nuwe metode, wanneer die waarde van die twee sgRNA's afstand verskil. Een verslag het getoon dat elke gRNA/FokI-dCas9-kompleks 'n spesifieke relatiewe oriëntasie het met 'n beperkte tussenliggende spasieerderlengte van 14–17 bp [32], terwyl 'n ander navorsingsgroep gevind het dat DNS-splyting deur samesmelting van katalities onaktiewe Cas9 en FokI nuklease (fCas9) vereis assosiasie van twee fCas9 monomere wat gelyktydig teikenplekke ~15 of 25 bp uitmekaar bind [33]. Dus, om aan die vraag te voldoen, moet verskilparameterwaardes noukeurig ingestel word. Die hoofuitvoerlêers wat deur die sgRNAcas9.pl-program geproduseer word, genaamd “report_protospacer_single.txt” en “report_protospacer_pairs.txt”, sal alle enkel- of gepaarde CRISPR-teikenreekse (5′-3′) rapporteer. Intussen word al die ooreenstemmende inligting vir elke teikenterrein verskaf, soos begin- en eindwaardes, volgordepatroon, GC-inhoud, sgRNA-afset, ens.

Om buite-teiken-effek te evalueer deur potensiële buite-teiken-splitsingsplekke te klassifiseer

Nadat CRISPR-teikenplekke geïdentifiseer is, moet die kandidaat-teikenvolgordes geëvalueer word vir die buite-teiken-effekte deur belyning met die genoom. Dit is die mees kritieke en 'n tydrowende stap. In hierdie studie is SeqMap gebruik om volle lengte (23 nt, insluitend NGG PAM-volgorde) van CRISPR-teikenvolgordes na heelgenoom te karteer. Verskeie studies het getoon dat die Cas9 wanpassings tussen sgRNA en sy teikenplek op verskillende posisies verdra op 'n volgorde-afhanklike wyse, sensitief vir die aantal, posisie en verspreiding van wanpassings [24]. Several groups have independently shown that CRISPR/Cas9 indeed induces off-target mutations, even at sites that differ by 5 nt from on-target sites in human cells [24]–[27]. In this case, the number of mismatches should be carefully determined. The optional argument of number of mismatches in the sgRNAcas9.pl program was thus set to enforce the search for sgRNA off-targets with user-defined values. The default maximum number of mismatches is set at 5 in this program.

Previous reports have shown that Cas9 nuclease cuts 3-nt upstream of the PAM site [34]. The 12 nt upstream of the PAM site are often referred to as the seed sequence and are the most critical determinants of cleavage specificity [8], [35]. For example, a mismatch in the seed region may cause a notable reduction of the cleavage activity of Cas9/sgRNA, while mismatches in the other regions of the protospacer (the non-seed region) have a much weaker effect [5]. Another report has shown that only the first seven base pairs near the PAM site are of great importance for recognition efficiency in bacteria [36]. To describe the position and distribution of mismatches in this study exactly, target sequences were first segmented into three parts: seed, non-seed and PAM (Figure 3A). Seed and non-seed sequences were further segmented into three parts: region I (1–7 bp), region II (8–12 bp) and region III (13–20 bp). As shown in Figure 3A, the seed region contains regions I and II, while the non-seed region only contains region III.

(A) Different segments of the target sequence. (B) The potential off-target cleavage sites (POT) were classified into three categories by count number and position of mismatches. (C) Distinction of true and false off-targets. (D) Evaluating the degree of risk of the POT. The dangerous degree of POT from low to high is dependent on the number and position of mismatches.

On the basis of the above consideration, potential off-target cleavage sites can be classified into three categories from the number and position of mismatches, as shown in Figure 3B. Type I, with 1∼5 mismatched bases, are only located on region III (non-seed region) Type II, with 1∼5 mismatched bases, is located on regions II and III Type III, with 1∼3 mismatched bases, is randomly distributed on the regions I, II and III, but with at least one mismatched base locate on the region I. The mapping result produced by SeqMap was re-analyzed and classified into three types on the above-described standards. The total numbers of mismatched bases were counted (‘N' in the PAM sequence is not counted as a mismatched base). Furthermore, as shown in Figure 3C, mismatched bases located on PAM sequences that cause a “NGG” change to “NAG”, are also not counted as mismatched bases. Furthermore, if the PAM sequence is changed to “NCG/NTG/NGA/NGT/NGC”, the corresponding predicted sequences should be discarded. In addition, the dangerous degree of potential off-target cleavage sites can be further evaluated (Figure 3D). This can be used to aid the determination of suitable CRISPR target sites.

To select CRISPR target sites with high specificity

After classification of potential off-target cleavage sites, candidate CRISPR target sites with minimized off-target effects can be selected. The workflow and filter criteria for selecting candidate CRISPR target sites with high specificity using sgRNAcas9 are shown in Figure 4. Predicted protospacers which are not located on the genome were first discarded. Any CRISPR target sequences which are mapped to multiple genomic loci are also discarded (Figure 4). Owing to the accurate prediction of potential off-target site, the degree of risk of the potential off-target effect was evaluated on the basis of the above-described standards (Figure 3D). For example, if sgRNAs carry single or two mismatched bases, which are especially located on the non-seed region, “off-target” cleavage may occur. Therefore, protospacers which contain off-target sites with 1 or 2 mismatched bases are discarded (Figure 4). Finally, useful information will be provided with a folder that named “Sort_POT_byID”. Each candidate sgRNA with potential off-target analysis result will be written into a separate file containing the following information – potential off-target DNA sequences with mismatched bases noted in lowercase letters, number of mismatched bases, ID, chromosome number, position, direction and type. In addition, to evaluate whether off-target sites are located in the gene coding region, perl scripts ot2gtf.pl and pot2gtf.pl can be used. Thus, the candidate CRISPR sgRNA with minimized off-target effects can not only be determined from the number of total off-target sites and potential off-target cleavage sites (POT), but also take into account the information of off-target genes. After a careful check of the specificity of sgRNA binding in the genome, CRISPR target sequences with high specificity will be selected by sgRNAcas9, and the results will be written into an output folder named “Final_report”.

To design oligonucleotides for constructing sgRNA expression vectors and extracting target sequence from nucleotide position

To construct a sgRNA expression vector, protospacer sequences should not contain repeat sequence as follows: more than 4 continuous T nucleotides (4∼6 nucleotide poly (T) tract acts as a termination signal for RNA pol III), or other homopolymer sequences (more than 5 continuous A or C or G, more than 6 dinucleotide or trinucleotide repeats). This step can be performed by check_sgRNA_seq.pl. Once candidate CRISPR target sites are determined, selected sequences can be used to design oligonucleotides. As described above, the sequence pattern of CRISPR target sites found by sgRNAcas9.pl are 5′-GGX18NGG-3′, 5′-GX19NGG-3′ or 5′-X20NGG-3′. Therefore, the sequence of GGX18, GX19 or X20 will be extracted and used directly to design 20-nt length of sgRNAs by using sgRPrimer.pl. To describe how to use this script to batch design oligonucleotides for constructing sgRNA expression vector, the pGL3-U6-gRNA-Puromycin vector (modified from Addgene 51133) was selected as an example, which is designed for expressing customizable sgRNA under control of the U6 promoter. Annealed oligos were cloned into the vector at a Bsa I restriction site. To facilitate cloning of the 20 bp target sequence, extra bases need to be added to the ends. In this study, ‘accg’ was added to the 5′ end of the sense oligo and ‘aaac’ to the 5′ end of reverse complementary sequence (anti-sense oligo). Then, equal amounts of the sense and anti-sense strands were synthesized and annealed to generate the ds-oligo. This product can be easily ligated into the digested pGL3-U6-gRNA-Puromycin vector.

To investigate on- or off-target cleavage effects, certain lengths of predicted sequence need to be extracted from the genome by nucleotide positions. Then cleavage sites can be validated by using the T7 endonucleases I (T7E1) assay or sequencing. This is another time-consuming step. To raise experiment efficiency and save time, extraction of target sequence by nucleotide position can be performed by extract_targetSeq.pl. The length of sequences extracted from genome was set as an optional argument in this program. A default parameter value was provided to extract DNA fragments up to 1,000 bp in length. Then the sequence was used as a template to design PCR primer pairs for validation of the Cas9 cleavage effect.


DD and JK-R contributed to study design, interpretation of results, and wrote the manuscript. JK-R injected the embryos. JP assembled the draft of transcriptome and genome. LC, DC, LK, IF, MB, and BC-HW performed screenings. LC revised the manuscript. All authors gave final approval for publication and accept accountability for the content and work performed.

This work was supported by the European Research Council (ERC) under the European Union’s Horizon 2020 Research and Innovation Programme (Grant Agreement No. 726049) to DD. JK-R and LC were also supported from the Czech Science Foundation (GACR Project No. 15-23681S).


MATERIALE EN METODES

Strain and plasmid availability

Escherichia coli en S. cerevisiae strains and DNA sequences reported here ( Supplementary Tables S3 and S4 ), along with their associated information (including annotated sequence files), have been deposited in the public instance of the JBEI Registry ( 17) (https://public-registry.jbei.org/folders/248) and are physically available from the authors. Because Cas9 has been implemented in many of the S. cerevisiae strains and recent literature cautions the creation of unintended gene drives upon mating of haploid yeast ( 18), all S. cerevisiae strains will be cured of any Cas9 plasmids prior to distribution. In order to keep the biosafety concern of creating gene drives low in this study, all S. cerevisiae strains were stored and maintained as haploids.

DNA design and construction

DNA cloning was performed using Gibson assembly ( 19) in E coli, or homologous recombination in S. cerevisiae. Plasmids were recovered from S. cerevisiae by lysing the cells mechanically using glass beads, followed by plasmid mini-prep (Qiagen) and transformation of the eluted fraction into E coli.

All pCut plasmids were derived from a pRS426 vector and have a 2 μ origin of replication and a URA3 marker. Cas9 is driven by the ADH1 promoter and CYC1 terminator. The sgRNA is driven by a tyrosine promoter with or without a HDV ribozyme structure, as indicated, and a SNR52 terminator. For the construction of the taxadiene synthase (TXS) library, the URA3 marker of the pCut plasmids was replaced by the LEU2 marker.

For characterizing the effect of promoter and integration locus on the protein expression level of GFP, promoter and terminator sequences were picked from the S. cerevisiae genome, defined as 600 bp upstream of the start codon, or 250 bp downstream of the stop codon, respectively. For the locus studies, a yeast enhanced GFP (yeGFP) cassette, driven by a TEF1 promoter and an ADH1 terminator, was integrated into each of the sites. For the promoter studies, a short-half life UbiM-GFP ( 20) was integrated into the ARS1021b site, preceded by each of the various promoters and followed by the ADH1 terminator.

Our CASdesigner web tool was used to design primers to create donor DNA fragments with 30–60 bp inter-fragment homology and 1-kbp flanking regions homologous to the respective target site. BY4742 genomic DNA served as a template to generate all flanking regions, promoters and terminator fragments. All other pieces were amplified from plasmids or from genomic DNA of previously integrated and sequence confirmed strains.

Strains, media and cultivation conditions

The parent S. cerevisiae strain used for integrating and characterization of loci, promoters and tags on GFP was BY4742 his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0>. The parent S. cerevisiae strain used for integrating and characterizing TXS variants was GTy116 leu2-3, 112::HIS3MX6-GAL1p-ERG19/GAL10p-ERG8 ura3-52::URA3-GAL1p-MvaS A110G /GAL10p-MvaE (codon optimized) his3Δ1::hphMX4-GAL1p-ERG12/GAL10p-IDI1 trp1-289::TRP1_GAL1p-CrtE(X.den)/GAL10p-ERG20 YPRCdelta15::NatMX-GAL1p-CrtE(opt)/GAL10p-CrtE>.

Promoter and integration locus characterization experiments were conducted in synthetic defined (SD, 0.67% (w/v) yeast nitrogen base without amino acids (VWR International), 0.2% (w/v) complete supplement mixture w/o yeast nitrogen base (Sunrise Science Products)) or standard rich media (YP, 1% (w/v) Bacto yeast extract, 2% (w/v) Bacto peptone) with 2% (w/v) sugar). Pre-cultures for taxadiene production were grown in YP-raffinose (YP supplemented with 2% (w/v) raffinose.). Production of taxadiene was performed in YP-galactose (YP supplemented with 2% (w/v) galactose). E coli DH10b, used for cloning and plasmid amplification, were grown in LB supplemented with 100 μg/ml carbenicillin.

S. cerevisiae transformation and integration confirmation

S. cerevisiae were transformed by electroporation based on a previously published protocol ( 21), using ∼2 × 10 8 yeast cells, 100 ng of plasmid and 1 μg of donor DNA for each transformation. When using multiple pieces of donor DNA, equimolar amounts of the fragments were used to a total of 1 μg. When performing gap-repair plasmid cloning, 100 ng of plasmid backbone and 200 ng of DNA encoding the sgRNA with 30 bp homology to the backbone on either side were used for transformation.

Saturated overnight cultures of S. cerevisiae were diluted to an OD600 of 0.15, and incubated at 30°C, shaking at 250 rpm until cells reached an OD600 of 0.8 to 1.2. The cultures were centrifuged for 3 min at 3000 rpm, and the cells were washed once with 45 ml ice-cold water and once with 45 ml ice-cold yZap buffer (1 M Sorbitol, 10 mM CaCl2), before they were resuspended in 20 ml yCondition buffer (0.1 M LiAc, 1 mM DTT) and incubated for 30 min at 30°C, shaking at 250 rpm. Afterward, the cells were centrifuged again for 3 min at 3000 rpm and washed once more with 45 ml ice-cold yZap buffer. The resulting cell pellets were resupended in n × 200 μl ice-cold yZap buffer (n = number of transformations) and stored on ice until use.

A total of 200 μl of cells were added to microcentrifugation tubes containing the transforming DNA. The DNA – cell suspension was added to pre-chilled 2 mm electroporation cuvettes and electroporated at 2.5 kV, 200 mA and 25 μF. Immediately after electroporation, samples were resuspended in 0.5 ml YPD. After incubation at 30°C at 200 rpm for 30 min, cells were centrifuged at 10 000 rpm for 1 min and the cells were resuspended in 100 μl double distilled H2O and plated on selective media plates. Plates were incubated at 30°C for 2–3 days, until colonies became visible.

Upon appearance of colonies, integration at the intended target site was confirmed via directed colony PCR prior to measurement of GFP or taxadiene levels. Additionally, all taxadiene strains were completely sequenced at the integrated locus to confirm that the integrated cassette(s) contained no mutations.

Flow cytometry

High-throughput flow cytometry experiments were performed using the Accuri C6 flow cytometer equipped with an autosampler (BD). Cells were cultivated in 500 μl YPD, CSM or YP-galactose in 96 deep-well plates at 30°C, 250 rpm for 24 h prior to being diluted to OD600 0.1 in 500 μl of the respective medium and cultivated under the same conditions until fluorescence measurements were performed in biological triplicate. Immediately before starting the fluorescence measurements, 1 drop of SPHERO TM Rainbow Calibration Particles (8 peaks, Spherotech, Catalog No: RCP-30-5A, Lot No: AG01) was added to 100 μl of the respective media in an empty well, dispersed and measured along site the samples to generate a standard curve and allow the calculation of molecules of equivalent Fluorescein (MEFL) values ( 16). A total of 30 000 events were recorded at a flow rate of 66 μl/min, and a core size of 22 μm. GFP was excited at 478 nm at 70 mW and emission detected at 530 nm. Data acquisition was performed as described in the Accuri C6 Sampler User's Guide. The acquired data were analyzed in the Accuri C6 Sampler software.

Taxadiene production

Strains were grown overnight at 30°C in 200 μl YP-raffinose, and the resulting cultures were used to inoculate (to an OD600nm of 0.05) 5 ml YP-galactose production cultures. The production cultures were overlaid with 10% (v/v) dodecane spiked with an internal standard of 200 mg/l C19 methyl ester (Sigma). A total of 10 μl of the dodecane overlay was mixed with 90 μl of ethyl acetate and analyzed using GC–MS and a previously described method ( 22) with modifications as follows. An initial temperature of 120°C was maintained for 3 min, followed by ramping to 250°C at a rate of 20°C/min to 250°C, and then held at 250°C for another 3 min. The total flow was set to 8.3 ml/min and helium flow was set to 1 ml/min. Taxadiene production measurements were performed in biological triplicates or quadruplicates. A standard containing known concentrations if the internal standard and taxadiene obtained from Phil Baran was used to determine titer.

Integration efficiency

A total of 100 ng pCut plasmid was co-transformed with 1 μg of the respective donor DNA as a three-piece gap repair (two 300 ng 1 kbp homology regions and 400 ng GFP cassette) in biological triplicate. Unless otherwise indicated, 48 clones from each transformation replicate were analyzed for GFP expression using the Accuri C6 high-throughput flow cytometer as described above, resulting in 144 clones analyzed in total for each integration locus.

Growth rate experiments

Saturated overnight cultures of S. cerevisiae grown in 500 μl YPD (1% (w/v) Bacto Yeast Extract, 2% (w/v) Bacto Peptone, 2% (w/ v) Dextrose) were diluted to an OD600 of 0.1 in 500 μl YPD in a 96 deep-well plate and cultivated at 30°C with shaking at 250 rpm. Samples were taken at 0, 4, 8, 12, 24 and 48 h post dilution. OD600 was monitored using a Synergy 4 (BioTek), preheated to 30°C.

High performance liquid chromatography (HPLC) analysis

Sugar and metabolite concentrations were quantified on a 1200 series HPLC (Agilent Technologies) equipped with an Aminex H column. Samples were filtered through 0.45 μm filters (VWR) to remove cells, and 5 μl of each sample was injected onto the column, preheated to 50°C. The column was eluted with 4 mM H2SO4 at a flow rate of 600 μl/min for 25 min. Sugars and metabolites were monitored by a refractive index detector, and concentrations were calculated by peak area comparison to known standards.

Experiment data availability

All flow cytometry and gas chromatography mass spectrometry data are available from the JBEI Experimental Data Depot (https://public-edd.jbei.org).

CASdesigner implementation, licensing and availability

CASdesigner is implemented in python 3.4 and third party libraries including biopython (http://biopython.org), pandas (http://pandas.org) and Intermine (http://intermine.org). CASdesigner is open-source software under the BSD license (https://opensource.org/licenses/BSD-2-Clause), is freely available from GitHub (https://github.com/JBEI/CASdesigner) and is also available through its web interface on the public CASdesigner webserver (http://casdesigner.jbei.org).


3 RESULTS

3.1 Heat-shock-induced CRISPR/Cas9 mutagenesis in the rice in vitro sneesdoekie

We used the soybean heat-shock protein 17.5E (HSP17.5E) gene promoter to express the humanized Streptococcus pyogenes Cas9 (SpCas9), and the tRNA-processing system to express two sgRNAs by the rice snoRNA U3 promoter (Czarnecka, Ingersoll, & Gurley, 1992 Xie et al., 2015 Fig. 1a,b). The motivation to use HSP17.5E promoter was based on its observed efficacy in controlling the Cre-lox recombination in the tissue culture-derived rice plants and seedlings. Earlier, we showed that a simple heat treatment of 42°C for 3 h led to efficient Cre-lox-mediated excision of the marker gene in rice seedlings and inheritance of the marker-free locus by their progeny (Nandy & Srivastava, 2012 ). We chose previously tested target loci and sgRNAs for this study that include rice Phytoene Desaturase gene (OsPDS) and the β-Glucuronidase transgene inserted in the rice genome (Srivastava et al., 2017 ). Vir GUS targeting, a well-characterized transgenic line, B1 (cv. Nipponbare), that harbors a single-copy of the GUS gene driven by the maize ubiquitin promoter (Ubi), and for PDS targeting, non-transgenic Nipponbare was transformed. The resulting hygromycin-resistant calli were maintained and regenerated at the ambient room temperature. For testing HS-CRISPR/Cas9 activity, randomly sampled calli were either kept at the room temperature (pre-HS) or transferred to the fresh media plate for heat-shock treatment, and analyzed 5–7 days later (post-HS). A total of 23 PDS and 12 GUS calli were screened for mutations at the two sgRNA sites (Table 1). Two out of the 12 pre-HS PDS calli were found to contain the targeted mutations, one of which contained monoallelic mutation at both sg sites, while the other showed biallelic heterozygous mutation at the sg2 site (Table S1). Similarly, one of the 6 pre-HS GUS samples showed mutations (monoallelic) at the sg1 target (Table 1 Table S2). The pre-HS mutations could be derived from the leaky HS-Cas9 activity and established early in the selection of the transformed clones. Accordingly, characteristic overlapping dual traces were observed in the pre-HS samples, representing heterozygous or chimeric clones (Figs 1c,d, 2a,b). Next, the calli were subjected to heat-shock (HS) treatment for 3 h and returned to ambient room temperature for further growth. After 5–7 days (post-HS), freshly grown tissue from each callus culture was analyzed. Since calli could contain multiple independent mutations, HS-induced targeting could contain multiple overlapping traces in the Sanger sequencing spectra downstream of the predicted DSB sites (Fig. 1c,d). Further, if induced mutations are rare in the post-HS samples, they would appear as the minor trace in the sequencing spectra (Fig. 2a,b). Accordingly, overlapping and/or minor traces in the sequencing spectra were found in 7 PDS and 3 GUS calli, indicating mosaic pattern of mutations due to HS-CRISPR/Cas9 activity (Table 1 Tables S1–S2). Mosaic pattern was observed at PDS sg1 site in 3 samples and at PDS sg2 site in 7 samples (Table S1). Similarly, mosaic pattern in GUS samples occurred once in the sg1 site and three times in the GUS sg2 site (Table S2). In summary, HS-CRISPR/Cas9 was effective in creating targeted mutations with a higher rate of targeting in post-HS calli (50–63%) as compared to the pre-HS calli (16%) of rice (Table 1). To verify these mutations, traces were separated using the CRISP-ID tool or subjected to TA cloning and colony sequencing. These analyses revealed indels at the predicted DSB sites, indicating CRISPR/Cas9 mediated mutagenesis (Fig. 1e–f, 2c,d). In conclusion, HSP17.5E-Cas9 is effective in creating induced targeted mutations in the rice calli. With the paired sgRNAs, HS-CRISPR/Cas9 generated HS-induced mutations in ≥50% of the transformants (Table 1). All callus cultures were subjected to plant regeneration however, PDS cultures mostly appeared non-embryogenic, while GUS cultures regenerated plants. Therefore, all subsequent work was done with HS-CRISPR/Cas9 targeting the GUS transgeen.


Kyk die video: Leer om tyd te lees in afrikaans - Oefentyd (September 2022).


Kommentaar:

  1. Nelrajas

    Jy is verkeerd. Ek is seker. Ek kan dit bewys. Skryf vir my in PM, praat.

  2. Alfred

    Ja, alles kan wees

  3. Sajinn

    Is jy bewus van wat geskryf is?

  4. Stanly

    I consider, that you commit an error. Ek kan dit bewys. Skryf aan my in PM, ons sal kommunikeer.

  5. Fesho

    Ek teken in op al die bogenoemde. Ons kan oor hierdie tema kommunikeer.



Skryf 'n boodskap