生命就像一台编程好的机器,可以重编程

编译:孙智、来源:The Economist

1 合成生物学,破陈出新

我们尝试从理解蛋白质合成的角度来理解生命。蛋白质执行了从代谢到复制几乎所有的基本生命功能,而无论是以何种方式形成的,蛋白质都是由20种氨基酸串联而成的多肽链。尽管蛋白质结构是极其复杂且难以预测的,但这几乎完全取决于氨基酸的顺序。

这些蛋白质的基因仅仅是一套氨基酸次序表。与计算机中0/1字符串的存储方式类似,这套信息在基因组中是用DNA碱基——A、C、T和G——的序列来记录的。将这些DNA碱基序列转变为氨基酸序列的程序被称为遗传密码,它使用四种DNA碱基,赋予64种不同的三字母字符串(如ACT或CTG)固定的氨基酸含义,我们称之为“密码子”。

想象一份包含一列密码子和一列对应氨基酸的“密码本”。解码基因需要逐个查找密码子并记下它们的氨基酸含义。这是一套简单的,参照规则的运作方法——一种算法。细胞执行相同的算法,但它使用的不是将密码子与氨基酸直接匹配的密码本,而是利用tRNA——一种能够识别密码子并携带氨基酸的小分子——和核糖体——用来提供tRNA与基因副本互作的位点——来进行解码。逐个氨基酸串联形成蛋白质的过程也就是逐个密码子读取基因的过程(参见下图)。

当生物以这种方式执行算法时,它看起来似乎更像是一台计算机了。但是生物不会像机器那样处理信息。在编写程序时,机器和作用于它的逻辑是分开的。计算机用户可以忽略硬件的物理原理和特性来修改软件程序。可是,进化却不做这种区分,它只是在处理分子相互作用,就像尼龙搭扣一样——tRNA与密码子的粘附,核糖体粘合氨基酸时的构象变化等等。从简单的蛋白质翻译到波澜壮阔的受精卵发育,生命的信息与处理无处不在,不可分割。生命运转的“软件”与“硬件”相互依赖,这使得它对人类的重编程具有很强的抵抗力。

但是,它也会被“黑客”入侵。使用从一个生物体中切割出一个基因并将其(通常是毫不客气地)灌输到另一个生物体的策略,生物技术几乎可以命令细胞生产它们本不需要的产品,例如仅有51个氨基酸的人类胰岛素(1978年,第一家生物技术公司Genentech生产的第一种产品),到含有上千个氨基酸的人工抗体。

对自然的开发是需求驱动的,直到今天依旧如此。大多数蛋白质都是天然存在的,它们能够执行形形色色的功能——调节血糖,杀死害虫或分解衣物上的污垢。很显然,这是一条盈利的门路:可以将这些蛋白质的基因放入细菌的基因组中,然后让它们分泌胰岛素,或者放入作物的基因组中赋予它们对害虫的抗性,或者在发酵罐中生产洗涤剂。从无到有地生产蛋白质不再是一件难事,让不同来源的蛋白质协同工作同样可行。

于是,自然界中注入了新的活力。蛋白质设计和DNA合成的发展使得创造自然界中本不存在的蛋白成为可能。但它们仍然不甚完美。但是因为DNA序列合成很便宜,所以可以测试很多的版本来看看哪些可以奏效。

因此,有些公司致力于发展新的代谢途径,这些途径整合了新近发现的酶,被人们熟知的酶和重新设计的酶。这是一种严谨的工艺:它不仅要求找到合适的酶,而且需要在十几个或更多的酶协同工作的情况下实现精确平衡的基因表达,更不用说调谐代谢强度以防止新途径的产物破坏底盘细胞中固有的代谢环境了。尽管存在诸多要求,但从目前的状况来看,在自然界中发现的任何小分子或多或少都能够成功地在发酵罐中使用酵母或细菌来生产。

两个十分有趣的生产实例分别是来自大麻的大麻素和来自罂粟的鸦片和吗啡衍生物。大麻素的结构与功能活性非常广泛,有些具有神经活性,有些可用于治疗;在某些管辖区内可以有许多合法的使用途径,而在其他地方则是非法的。Keasling博士及其同事今年2月描述的一组大麻素合成途径为治疗和消遣提供了可能性,后续将由Demetrix公司进行进一步探索。Keasling博士的学生Christina Smolke开发了一种能够产生吗啡及其多种衍生物的代谢途径,提供了更加典型的案例。目前Smolke成立了Antheia公司,致力于生产低价、低成瘾风险的鸦片类制剂,旨在让全世界数千万疼痛病患能够获得更为安全的舒缓疗法。

2 代码突破

至少从化学的角度来看,创造新酶以催化从未有过的化学反应是比重塑和改进天然化合物更为激进的策略,比如酶法催化碳硅成键的反应。化学家对此非常擅长,他们创造的有机硅化物被广泛用在电子,制药,建材,假体植入等。然而生命不使用碳-硅键,因此也没有天然酶合成它们。

2016年,加州理工学院的Frances Arnold补充了自然界的不足。她利用进化技术创造了一种将硅固定在碳上的酶,为生物学打开了一个全新的化学领域。 她现在正利用机器学习的手段来改进她的定向进化技术(2018年诺贝尔生理医学奖),可以更好地减轻主观导致的盲目性。 她认为合成生物学原则上可以为化学家提供绝大多数反应所需要的酶,这些反应目前尚在使用稀有催化剂,高温和高压或环境不友好的溶剂。

除了创造新的蛋白质,还可以创造新的RNA,这就是CRISPR基因编辑的工作原理。一个RNA分子被生产出来,锚定到基因组中的特定位置;而后一个伴侣蛋白开始切割被“高亮”显示的DNA序列。 一旦DNA被断开,新的基因或基因片段就有机会插入到这个间隙中。如果将表达CRISPR RNA及其蛋白质的基因以特定条件诱导表达的方式放入细胞中,那么就拥有了一个可以通过条件控制来重新编程基因组的细胞。

如果想要从头开始编写基因组,可以有多种方式轻易地把它搞乱。目前,世界范围内十个实验室组成的联盟正在重写酿酒酵母的整个基因组,希望其成为比现在更好的遗传研究实验模型。为此,他们将6,000多个基因的最合适的版本以及它们之间发现的大多数有时重要的衔接区段精心拼接在一起,总共超过12 Mb。该项目同时将一套控制系统写入基因组,当它被激活时,它会进行自我切割并重排内部基因。伦敦帝国理工学院的Tom Ellis说,这项技术将会为进化研究提供强大的新工具。

所谓的“Sc 2.0”与酿酒酵母不同的更深层原因是它的遗传密码略有不同。DNA的64种密码子中有三种描述的不是氨基酸,而是一个动作:“停止”。 这三个密码子——TAG,TAA和TGA——告诉核糖体及其tRNA:“这是这个基因的终点,别添加氨基酸了,你们已经造好这个蛋白了。”然而,在重新设计的酵母中,只使用了这三种终止密码子中的两种。天然的酵母基因组的蛋白质编码基因的末端只要含有未选定的终止密码子(TAG),编写Sc 2.0的科学家就会把它替换为其他的终止密码子(TAA或TGA)。这意味着在Sc 2.0中TAG没有任何意义——因此它可以用来表示新的东西。

大自然通常使用20种氨基酸来制造蛋白质。但是还有数以百计的氨基酸可以使用,其中一些会带来有趣的新属性。在Sc 2.0中,通过设计识别TAG密码子的新tRNA分子和将新氨基酸粘附到该tRNA上的新酶,可以使TAG密码子转变成为编码氨基酸的密码子成员之一。如此配备的细胞将能够利用全新的氨基酸。

这个方法并不止步于此。遗传密码使用61种密码子来编码20种氨基酸; 而某些氨基酸会有多个密码子“同义词”。 以无同义词的形式编写有机体的DNA是一项组合任务,这类似于选择在写作时避免使用共同的语言符号,例如“e”; 结果可能看起来有点无趣,但是是可以做到的。用较少的同义词重写代码,这样就拥有了更多的密码子用于引入非天然氨基酸。这就有可能为治疗感染提供一种细菌防御机制所不能应对的药物。细菌已经进化到可以对抗天然的蛋白质的程度,但若是投入他们从未见过的氨基酸,其中一些防御措施或许就将不再适用。

定制遗传密码的吸引力还在于超越现有的“词汇量”。今天的遗传密码的普适性使得病毒得以“奴役”遭受感染的细胞,从病毒基因中制造出病毒蛋白。使用另一套遗传密码的基因组对于这种攻击是坚不可摧的;病毒的基因将不能描述它所需的蛋白质。因此,重新编码可以使细胞免疫任何病毒攻击; 事实上,已经有人在细菌中实现了这一目标。

如果它有效,这种重新编码的策略可能对现有的生物技术非常有帮助。永远不会被污染的发酵罐和无法“偷渡”病毒的生产抗体的细胞系将会是一个巨大的福音。甚至可以构想密码子以如此激进的方法编码氨基酸,以至于合成生物学在某种程度上成为了一个独立的“创世”,它从原始的生物体中萌发,却又不再与其平行的生物圈接触;其间居住着既不传染也不感染的生物,只有符合设计的意向才能与创世的其余部分联系起来。

今年1月,佛罗里达州应用分子进化基金会的Stephen Benner和他的同事们在Science杂志上发表的一篇论文中可以看到这种奇幻景观的影子。他们创造了一套既包括现有的A、T、C、G,又含有补充的Z、P、S、B的双螺旋。 这种hachimoji(“八字母”)DNA提供了比过去40亿年更加密集的可用数据存储量。例如,如果希望使用hachimoji来重新设计核糖体,tRNA等,就可以使用双联体而不是三联体作为密码子来重新编码基因组。

有人想要试一试吗?现有代码的潜力巨大,理论上可以描述的蛋白质尚未探索完毕;似乎没有必要这般大费周章。更何况,工程师们乐于做大自然的“修补匠”。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();