相当大的生命科学研究取决于重组DNA分子的构建或分析。这些分子的确切顺序对于他们是他们是的一部分的科学工作的再现性至关重要。每个出版物都异常伴随着克隆策略的AD-HOC描述。不幸的是,大多数公布的克隆策略都是不完整或暧昧的,有些人明显错了。手动后克隆策略是一个艰巨的过程,这可能是为什么这类审查过程中等许多错误。PyDNA是Python的延伸,用于紧凑的克隆策略表达。jupyter笔记本中的Pydna可以通过具有Python的基本知识的用户读取,因为叙述格式类似于传统的自由形式描述。通过简单地重新执行笔记本,可以易于验证这些克隆策略。额外的好处是使用自动集成服务自动验证,例如github动作。
问题
代谢工程是一种生命科学领域,往往涉及调制代谢物生产的代谢途径,旨在产生所谓的细胞工厂用于生物技术上有趣的分子。相信细胞工厂在过渡到绿色经济中发挥未来作用。在我自己的实验室中,我们试图通过将新的基因插入Baker的酵母,产生辣椒部分的辣椒蛋白分子的脂肪酸部分,基本上是用于在家里制作面包的相同的生物体。
图1:从大肠杆菌(绿色)的基因转移到面包酵母细胞(蓝色)。最终目标是在辣椒素(红色盒子)中产生脂肪酸。地图cláudiabarata.米浩大学。
我们需要通过将较小的DNA分子组合成较大的DNA分子来确保新的DNA分子在细胞内稳定地保持和功能(重组DNA)根据计划,通常称为a克隆策略。
那么为什么相当挑衅的博客标题?事实证明,许多涉及重组DNA的学术出版物不含实验中使用的DNA结构的完整毫不含糊的克隆策略。克隆策略有时是通用的,就像“基因x被克隆在质粒y中导致质粒z”。(一种质粒是一个小圆形DNA,可以自行复制克隆在这种情况下,意味着简单地将DNA分子连接在一起。)这不是将质粒Z重建的足够的信息,使研究质粒Z IRRORoDucible的研究。未能记录进入克隆策略的确切努力是不幸的,因为它们包括一系列简单的单位操作,在一起的结果几乎总是确定性。
克隆策略的描述
手动规划克隆项目,其中点击DNA编辑器与从数据库或DNA测序实验获得的序列文件一起使用,非常普遍。这些数据文件,序列登录号,PCR引物序列等是必需的,以便在进行最终构建序列的操纵中体外要么在硅中。即使提供此信息,否则不保证它是正确的,除非手动重新创建每个步骤。然而,这可能并不容易,因为没有广泛采用的标准,用于准确应包括什么信息或如何描述克隆策略。
pydna:可执行的克隆策略
克隆策略可以使用PyDNA包在Python中正式表达。PyDNA能够以紧凑的方式处理最常见的副克隆技术(即用于将DNA分子拼接在一起的技术)。Jupyter Notebook支持通常已经用于描述克隆实验的线性叙述格式。
pydna在实践中
在合成酵母中合成辣椒素脂肪酸的若干遗传修饰之一是来自细菌的脂肪酸合酶基因ACPH(酰基载体蛋白磷酸二酯酶)的表达大肠杆菌。在称为PYPKA的质粒中克隆该基因将被用作如何使用PyDNA的简单示例。
图2:用限制酶(PACMAN)切割PYPKA质粒。通过PCR扩增来自大肠杆菌的ACPH基因。最后,两种DNA分子都是通过连接组合的。
通过限制酶克隆构建质粒构建
第一步是从PyDNA导入一些需要的功能。
这PYPKA.从本地文本文件中读取质粒。该DNA分子是圆形的。
限制酶AJII.从Python Package Biopython导入。(一种限制酶是一种分子剪刀,可以以可预测的方式切割DNA链。)
圆形质粒使用限制酶线性化,该限制酶在单个独特的位置切割质粒。
进入格纳银行需要下载ACPH基因。国家生物技术信息中心(NCBI)提供了一个名为“电子公用事业“可以从Python访问。在执行此脚本之前更改下面的电子邮件地址,因为您应该在使用电子实用程序时始终提供电子邮件地址。
ACPH基因从下面的Genbank下载。
下载的基因可以在此处查看:nc_000913 424337-424918。我们通过将DNA序列印刷为字符串来检查基因:
通过使用该基因从源DNA(通常称为模板DNA)复制P.烯键酶ChR.反射(PCR)。相对较短,特异性DNA片段相对于模板DNA大量复制。(PCR偶文还用于检测像Covid-19这样的传染病。)以下两个PCR引物(868&867)用于PCR扩增ACPH基因。PCR引物是用于指导PCR基因复制过程的单链DNA的短片。
通过PCR使用两种PCR引物合成基因:
我们可以可视化引物如何静置在acph基因的每一端:
最终载体从两个线性DNA分子连接在一起:
我们只需将两个直链DNA分子添加在一起,并告诉PyDNA,我们使用环状方法想要循环序列。然后,我们可以使用Write方法将质粒写入文件。
提供了上面完整示例的Jupyter笔记本这里。
通过同源重组的质粒构建
我们在前面实施例中制造的质粒不足以使基因有效。基因通常需要一个启动子A.终结者为了录制。启动子和终结者是发起和结束的DNA片段转录,这使得基因的RNA拷贝(mRNA)。
通常使用的同源重组和Gibson组装技术以组装更大,更复杂的重组DNA分子。这些技术需要在DNA末端的短程相同的DNA序列。PyDNA实现DNA组装算法,其仅取决于分子的DNA序列。在下面的实施例中,我们使用PyDNA模拟同源重组以使我们在前面实施例中克隆的基因表达质粒。
图3:用限制酶(Pacman)切割pypkpw质粒。通过PCR获得启动子,ACPH基因和终止剂。四个线性DNA分子通过共用的DNA序列重组,以形成新的圆形分子。
我们读取来自本地文件的DNA序列。
PYPKA_Z_RPL17A和PYPKA_E_RPL16B质粒类似于前述实施例中构建的质粒,但分别携带启动子和终止子。我们使用三对PCR引物来合成三种PCR产品:
通过用限制酶消化来引导质粒载体EcoRv.。
装配算法通过参数中的DNA序列看,丢弃比一定限度短的序列。
组装类有两种可供选择的方法,汇编_Circular和Assemble_Linear,具体取决于组装的目标。我们对循环大会感兴趣。
我们有两个用于PYPK0_RPL17A_ECH_RPL16B矢量的循环产品。这是预期的,因为两种分子彼此相反的补充。
我们可以在新的圆形质粒中可视化四种线性DNA分子如何结合在一起。下图中的数字是共享相同序列的长度。
上面的代码示例省略了简洁性的一些基本步骤。有一个完整的同源重组例子的Jupyter笔记本可以使用这里。
结论
目前对采用PyDNA的障碍是与某些生物学家仍然持有的“写作代码”相关的略有否定视图。但是,由于此字段中生成的数据不断增加,编程可能是未来生物学家工具箱的一个组成部分。PyDNA和类似工具可以帮助实现生命科学的再现性的斗争。
致谢
通过项目Fatval PTDC / Eam-Amb / 032506/2017通过FCT I.P资助的ProjageCiênciaETecnologia葡萄牙(FCT)支持这项工作得到支持。并通过ERDF通过Compete2020 - Programa Operacional CateritIvide ade EInternacionalizacão(Poci)。CBMA由国家资金通过FCT I.P资助的战略计划UIDB / 04050/2020支持。
关于作者
Björn约翰逊是普罗瓦大学在葡萄牙布拉加的生物学系助理教授,他领导了一个小型研究小组并教授生物学。他的研究领域是酵母生理学和代谢工程,他的团队正试图扩大面包酵母的新陈代谢,包括有趣的新产品和基材。Björn在生物学之外对生物信息学和开放可重复的科学感兴趣。自2007年以来,他也是一个开源软件爱好者,在桌面上使用Linux。
---
关于制造商博客系列
Anaconda正在放大其中一些最活跃和珍视的社区成员的声音每月博客系列。如果您是一位寻找机会讲述故事的制造商,请在最喜欢的项目中详细说明,教育同龄人,并建立您的个人品牌,请考虑提交摘要。有关更多详细信息,并访问丰富的教育数据科学资源和讨论线程 - 包括关于此博客的一个博客Anaconda核心。