创造阿尔法狗的公司,如今要解开生物学最大秘



计算机生成与新冠病毒相关的蛋白质ORF8图像。图像由DeepMind开发的人工智能系统支持绘制。图片来源:COURTESY OF DEEPMIND

2016年3月13日深夜,气温相当寒冷,两名男子头戴羊毛帽,身穿厚厚的外套,并肩走过韩国首尔市中心拥挤的街道。二人热烈地交谈,似乎完全忽视了周围饺子馆和烧烤店霓虹灯的诱惑。他们此行韩国肩负重任,多年的努力终于能够看到结果。最棒的是,他们刚刚成功了。

这次散步是为了庆祝。他们取得的成就将进一步巩固他们在计算机史上的地位。在古老的战略游戏围棋领域里,他们开发的人工智能软件已经充分掌握了个中奥秘,而且轻松击败了全球顶尖选手李世石。如今,两人开始讨论下一个目标,身后跟踪的纪录片摄制组捕捉到了当时的谈话。

“告诉你,我们可以解决蛋白质折叠问题。”德米斯•哈萨比斯对同伴大卫•西尔弗说。“那才是大成就。我相信现在能够去做了。以前我只是想过,现在肯定可以做成。”哈萨比斯是总部位于伦敦的人工智能公司DeepMind的联合创始人及首席执行官,正是该公司开发出了AlphaGo(阿尔法狗)。西尔弗则是DeepMind的计算机科学家,负责领导AlphaGo团队。

四年后,DeepMind实现了当年哈萨比斯在首尔散步时的设想。公司开发出了人工智能系统,能够根据基因序列来预测蛋白质的复杂形状,精确到单个原子宽度。靠着这项成就,DeepMind完成了需要近50年才能完成的科学探索。1972年,化学家克里斯蒂安•安芬森在诺贝尔奖获奖演说中提出,只有DNA才可以完全决定蛋白质的最终结构。这是惊人的猜想。当时连一个基因组都未完成测序。安芬森的理论开创了计算生物学的分支,目标是用复杂的数学模拟蛋白质结构,而不是实验。

DeepMind在围棋方面取得的成就确实很重要,但在围棋和计算机科学这两个相对偏僻的领域之外,几乎没有产生什么具体影响。解决蛋白质折叠问题则完全不同,对大多数人来说都有变革意义。蛋白质是生命的基本组成部分,也是大多数生物过程背后的运行机制。如果能够预测蛋白质的结构,将彻底改变人们对疾病的理解,还可以为癌症到老年痴呆症等各种疾病开发全新也更具针对性的药物。新药上市时间有望加快,药物研发成本减少数年时间,成本也节约数亿美元,还可能会拯救很多生命。

DeepMind的联合创始人及首席执行官德米斯•哈萨比斯。他早年痴迷国际象棋和电子游戏设计,后来对开发人工智能系统产生兴趣。图片来源:Courtesy of DeepMind

DeepMind首创的新方法在抗击SARS-CoV-2(也就是新冠病毒)的斗争中已经取得成果。以下是以游戏知名的公司如何揭开生物学最大秘密的故事。

形状莫测的积木

“蛋白质是细胞的主要机器。”加州大学伯克利分校的生物工程教授伊恩•霍姆斯表示。蛋白质的结构和形状对其工作方式至关重要,构成蛋白质分子晶格的小“口袋”是发生各种化学反应的地方。如果能够找到某种化学物质与其中一个口袋结合,这种物质就可以作为药物阻止或加速生物过程。生物工程师还能够创造出自然界中从未出现的全新蛋白质,而且具有独特的疗效。“如果我们可以利用蛋白质的力量,合理地设计用途,就能够制造出神奇的自我组装机器,发挥一些作用。”霍姆斯说。

但为了确保蛋白质达到想要的效果,把握其形状很重要。

蛋白质由氨基酸链组成,常被比作细绳上的珠子。至于珠子按照什么顺序穿起来,信息都存储在DNA里。但是,根据简单的基因指令很难预测完整的链条会形成多复杂的物理形状。氨基酸链根据分子间吸引和排斥的电化学规则折叠成某种结构。形状常常类似绳索和丝带缠绕而成的抽象雕塑:褶皱的带状物加上莫比乌斯带,就像卷曲环状的螺旋。20世纪60年代,物理学家和分子生物学家塞勒斯•列文塔尔发现,一种蛋白质的形状有太多可能性。如果想通过随机尝试组合找出蛋白质的准确结构,花的时间比已知宇宙的年龄还长。而且,几毫秒内蛋白质就会完成折叠。该观察被称为列文塔尔悖论。

到目前为止,只有通过所谓X射线晶体衍射才可以接近准确了解蛋白质的结构。顾名思义,首先需要将含有数百万蛋白质的溶液转化为晶体,本身就是很复杂的化学过程。然后,X射线发射到晶体上,科学家从获得的衍射图逆向工作,从而建立蛋白质图像。而且,还不是随便什么X射线都可以。要想获得很多蛋白质的结构,要由圆形的,大小堪比体育场的同步加速器发射X射线。




上一篇:研究揭示哺乳动物PA28αβ-iCP免疫蛋白酶体的结构及激活机制
下一篇:沈阳生态所揭示增温对土壤微生物残留物分解的