基于CRISPR/Cas9的基因表达的多重精准调控对合成生物学中的代谢调控具有重要意义。然而,多重编辑的sgRNA表达盒中包含多个长重复DNA序列,这些重复的DNA序列在体外组装中带来了重大挑战,包括突变和缺失,并导致体内遗传不稳定性,特别是在具有强大同源重组能力的生物体中。


近日,来自北京理工大学的郭淑元和霍毅欣实验室在bioRxiv上线文章“Design nonrepetitive and diverse activity single-guide RNA by deep learning”,开发了一个深度生成模型sgRNAGen,用于从头生成一系列具有活性的非重复和多样化的sgRNA。为了评估sgRNAGen产生的sgRNA的质量,研究通过靶向必需基因来评估它们的活性,结果表明,98%的sgRNA在枯草芽胞杆菌中具有活性。对所生成的sgRNA进行进一步验证,以用于单基因编辑、大片段敲除和多重编辑。结果显示,用于非必需bdhA基因的靶向敲除,编辑效率范围为12.5% ~ 75%。对于大片段的敲除,使用2个sgRNA能够大幅提升敲除效率,但由于sgRNA骨架的重复序列,构建这种质粒困难,使用sgRNAGen生成的非重复的sgRNA简化了质粒的构建,且大片段敲除最高可敲除169.5 kb的长片段,效率达到100%。进一步的,非重复sgRNA能简化多靶编辑质粒构建,可同时靶向3个位点,编辑3个位点效率为30-70%。此外,研究开发了一个CRISPRi系统,利用设计的sgRNA以期望的强度和高精度调节基因表达,实现了对sfGFP表达水平34.6% ~ 73.4%的抑制。


总的来说,研究开发的深度学习模型SgRNAGen提供了一种设计非重复和多样化活性sgRNA的方法,增强了代谢控制,并促进了合成生物学的应用。



来源公众号:合成生物催化剂工程2