首页 > 财经 > 正文

NVIDIA助力Evozyne创建用于生成蛋白质的生成式AI模型

2023-01-12 22:52:24来源:动脉网  

初创企业Evozyne使用NVIDIA(英伟达)提供的预训练AI模型,创造了两种在医疗和清洁能源领域具有重大潜力的蛋白质。

初创企业Evozyne使用NVIDIA(英伟达)提供的预训练AI模型,创造了两种在医疗和清洁能源领域具有重大潜力的蛋白质。


(相关资料图)

在今日发布的一篇联合论文中描述了这一过程及产出的蛋白质氨基酸序列。其中一种蛋白质用于治疗一种先天性疾病,另一种则可用于消耗二氧化碳以减少全球变暖。

初步研究结果展示了一种加速药物研发的新方法。

Evozyne联合创始人、论文共同作者Andrew Ferguson表示:“令人欣喜的是,这个AI模型第一轮产出的合成蛋白质就像自然生成的蛋白质一样。这表示该模型已经学会了自然界的设计规则。”

革命性的AI模型

Evozyne使用了NVIDIA的ProtT5。ProtT5是一个Transformer模型,是用于创建医疗AI模型的软件框架和服务——NVIDIA BioNeMo的一部分。

分子工程师Ferguson的研究领域涵盖化学和机器学习领域,他表示:“BioNeMo非常强大。它让我们能够训练模型,然后以非常低的成本使用该模型来运行工作任务——在几秒钟内就能生成数百万个序列。”

该模型是Evovyne ProT-VAE流程的核心。ProT-VAE是一个工作流,其将BioNeMo与作为过滤器的变分自编码器(VAE)相结合。

他表示:“几年前,还没有人注意到可以使用大型语言模型与变分自编码器相结合的方式来设计蛋白质。”

让模型向大自然学习

就如同人读万卷书,NVIDIA的Transformer模型会读取数百万种蛋白质中的氨基酸序列。该模型运用神经网络用来理解文本的技术,学会了大自然如何构建蛋白质氨基酸序列的方式。

然后,该模型预测了如何组装出能够满足Evozyne需求的新蛋白质。

他表示:“这项技术正在助力我们开展工作,以实现十年前无法实现的梦想。”

无限的可能性

机器学习有助于研究大量可能的氨基酸组合,这些组合的数量会达到200位数。

传统的蛋白质工程设计方法(即定向进化)采用的是一种缓慢、无计划的方法。这种方法只能用于固定大小的蛋白质,且一次只能改变其序列中的少数项目。

Evozyne的ProT-VAE流程将NVIDIA BioNeMo中强大的Transformer模型与变分自编码器(蓝色)相结合。

相比之下,Evozyne的方法只通过一轮,就能改变任何大小的蛋白质中的数万个特定氨基酸。

他表示:“我们正在实现技术上的飞跃,这将带来巨大的进展。”

计划使用云服务

Evozyne计划使用新的工艺来构建各种能够对抗疾病和气候变化的蛋白质。

另外,该公司致力于助力药物和能源研究者通过未来的云服务来使用其软件,满足他们的应用需求。

根据Gartner市场研究统计,到2025年,使用生成式AI技术系统研发的新药和材料比例将超过30%,而现在这一比例是零。

NVIDIA如何提供帮助

Ferguson表示:“NVIDIA在此方面是一家非常出色的合作伙伴。”

Evozyne数据科学家Joshua Moller表示:“我们通过将工作扩展到多个 GPU 来加快训练速度。从而将训练大型 AI 模型的时间从几个月缩短到一个星期。”

Ferguson则补充说道:“所以我们能够训练出原本不可能训练出的模型,比如一些有数十亿可训练参数的模型。”

未来将更加令人期待

使用AI加速蛋白质工程的前景十分广阔。

Ferguson注意到了扩散模型近期的发展:“这个领域的发展速度快得令人难以置信,我真的很期待日后的进一步发展。”

“没人知道我们五年后将能够走多远。”

关键词:

责任编辑:hnmd003

精彩推荐

最近更新