“行业观察者”是我们针对人工智能、XR、元宇宙和Web3等前沿科技而设立的专栏,主要分享这些领域中的新兴企业或者创业者们的故事。生物学前沿人工智能研究实验室EvolutionaryScale近日宣布获得超1.42亿美元种子轮融资,同时发布里程碑式AI模型ESM3。这家成立仅一年的公司在AI生命科学领域有着怎样独特的理念?全新的蛋白质大模型又有着怎样的技术突破?以下是我们的第17期内容,以下Enjoy。
一周前,在Meta如火如荼地卷文生视频赛道的时候,那个被它解散的蛋白质团队EvolutionaryScale获得了超1.42亿美元的种子轮融资,这个融资额在整个生物技术领域都可以说是高得离谱。
去年八月,Meta官宣旗下的蛋白质折叠团队Meta-FAIR解散。这个纯粹的“科学+AI”项目并不能让Meta快速获得收益,Meta专注商业化AI的决定看似也是情理之中。
然而,这个不被看好的团队竟用仅仅一年的时间就打了Meta的脸。他们最新推出的ESM3被认为是生物学领域具有里程碑意义的生成式AI模型,为生物学编程开创了新的可能性。
1.项目名称:EvolutionaryScale
2.成立时间:2023年7月
3.产品简介:
开发用于创造新型蛋白质和其他生物系统的大型语言模型——ESM,目前已迭代到ESM-3。4.创始人团队:
首席科学家:Alexander Rives (纽约大学计算机科学博士、前Facebook AI科学家)
Tom Sercu
Sal Candido
5.融资情况:
2024年6月25日完成了高达1.42亿美元的种子轮融资。本次融资由Nat Friedman和Daniel Gross以及Lux Capital领投,亚马逊、NVentures(英伟达的风险投资部门)和天使投资人参投。
人工智能的进步为生物科学研究创造了前所未有的机会,包括设计功能性生物分子,尤其是蛋白质。将人工智能运用于蛋白质设计,不仅可以提升蛋白质设计的效率及成功率,还通过快速应对传染病爆发等方式,来帮助人类解决一些正在面临的挑战。
Alexander Rives等人正是看到了蛋白质设计方面的缺口,决定开发基于深度学习的大模型,从而推动产业级蛋白质设计进入“全自动智能生成时代”。
于是,EvolutionaryScale应运而生。它是一家专注于生物科学领域的前沿AI研究实验室,致力于推出生物学前沿的语言大模型。
有意思的是,该公司创始团队的八位成员全都来自于Meta的FAIR(基础人工智能研究)部门。尽管在世界级的社交媒介巨头那里吃了瘪,但初始团队的核心人员都没有放弃,反而快速地投入新战地,开始在原有团队成果的基础上开发下一代模型。
EvolutionaryScale的大模型支持健康、环境科学等领域的研究与开发,不停探索生物学的扩展性,为突破性的科学研究提供动力。其中最显著的成果就是蛋白质折叠技术的突破,ESM模型揭示了数亿个宏基因组蛋白质的结构,帮助世界各地的科学家来模拟和理解蛋白质。
EvolutionaryScale旨在通过开放、安全的研究方式,来指导蛋白质设计领域的人工智能技术开发。
在此基础上,该公司作为签署方,引领了超160位来自学术界、政府以及民间的全球利益相关者,共同发展这项技术,确保其安全可靠,从而达成造福人类健康和社会的愿景。
正是由于怀着引领生物学界先进AI技术的责任感,Alexander Rives和他的团队从未停止脚步。
此前,EvolutionaryScale曾发布过大型语言模型ESM1,这被认为是第一个用于蛋白质的transformer语言模型,由EvolutionaryScale的创始团队在Meta的FAIR部门工作期间所构建。作为ESM1升级模型的ESM2拥有1500万个参数,并且相较于旧模型ESM1b(拥有6.5亿个参数)表现更佳。
上周,EvolutionaryScale发布了最新的ESM3 AI模型,这是朝着生物学的未来所迈进的一大步。凭借这种模型的能力,有可能会加速广泛应用的发现,有利于创造有助于捕获碳的蛋白质,从而开发出新的癌症治疗方法。
ESM3是一个生成式的AI模型,主要功能是生成新型蛋白质。该模型通过深度学习技术,使用大量的蛋白质数据进行训练,从而学习蛋白质的序列、结构和功能之间的关系。
ESM3的训练使用了超过1万亿teraflops的计算能力,这是目前已知生物学领域中最大的计算规模。它在地球上自然多样性的27.8亿种蛋白质数据集上进行了训练,使其能够同时对蛋白质的序列、结构和功能进行推理。
ESM3的主要工作流程可简略为以下四个步骤:
数据收集与处理:EvolutionaryScale首先会从各种来源收集大量的生物学数据,包括基因序列、蛋白质结构、功能注释等。这些数据会经过清洗、标准化和格式化处理,以便于后续的分析和应用。
模型训练:使用深度学习算法和大量的计算资源,EvolutionaryScale会对处理后的数据进行训练,构建出能够理解和预测生物学规律的大型语言模型。这些模型不仅具有高度的准确性,还能够处理复杂的生物学问题。
生成新蛋白质:通过交互式提示,ESM3能够生成新的蛋白质,这些蛋白质可能在自然界中需要数亿年才能进化出来。
科学验证:生成的新型蛋白质将通过科学实验进行验证,以确定其功能和潜在应用。
目前,ESM3最引人注目的使用案例之一是生成了一种新的绿色荧光蛋白(GFP)。
GFP是自然界中最美丽和独特的蛋白质之一,负责水母的发光和珊瑚的鲜艳荧光色。ESM3通过一系列思考过程,跨越了5亿年的进化,创造了这种新的荧光蛋白。这一过程在自然进化中可能需要超过5亿年,而ESM3通过计算方法实现了这一飞跃。
ESM3的发布也为药物发现和合成生物学领域带来了革命性的变化。
在药物发现方面,ESM3能够生成具有特定生物活性的新型蛋白质,为药物筛选和优化提供了更多的候选分子。同时,ESM3还能够预测和优化药物与靶点的相互作用机制,为药物的设计和开发提供更加科学的依据。
在合成生物学方面,ESM3能够生成具有特定功能的生物系统,为生物制造和生物能源等领域提供了新的解决方案。例如,ESM3可以生成出将二氧化碳高效转化为有机物的酶系统,为碳捕获和利用提供了新的途径。
EvolutionaryScale的ESM3模型代表了AI在生物学领域的新里程碑。通过其强大的生成能力和与行业领导者的合作,ESM3有望加速新型蛋白质的发现和生物系统的设计,为未来的药物开发、材料科学和环境科学等领域带来革命性的影响。
合成生物学是EvolutionaryScale未来发展的一个重要方向。通过设计和合成新的基因电路和生物路径等方式,科学家们可以创建具有特定功能的生物体。
基因电路类似于电子电路,但它们在细胞中控制生物学过程。
基因电路能够在细胞内实现对特定基因表达的精确控制。例如,可以设计一个基因电路,使其在细胞检测到特定信号(如某种化学物质或环境变化)时启动或关闭特定基因的表达。
合成生物路径涉及多种酶和代谢途径的组合,用于生产有价值的化合物。
通过AI分析和设计,科学家可以创建新的代谢途径,使生物体能够合成天然条件下无法产生的化合物。例如,通过重新设计微生物的代谢路径,微生物可以生产出医药中间体、生物燃料或工业化学品。
细胞工厂是通过基因工程手段改造微生物,使其在工业条件下高效生产目标产品的生物系统。
通过AI辅助设计,科学家可以改造微生物的基因组,使其在特定条件下表现出优异的生产性能。例如,通过编辑酵母或细菌的基因,科学家可以使这些微生物高效生产抗生素、酶或其他生物制品。
若此项技术能继续发展,不仅将推动科学研究的前沿发展,还能为医药、环境保护和农业等领域带来重要的应用前景。
EvolutionaryScale正通过AI和大数据分析技术推动个性化医疗的进步,为患者提供更加精准和高效的医疗服务。
个性化医疗是基于每个患者的独特生物学信息和临床数据,量身定制最合适的治疗方案。其中一个关键领域是基因组分析。通过对患者的基因组进行全面测序和分析,科学家可以识别出与疾病相关的基因变异。
EvolutionaryScale利用AI技术,快速准确地解析大量基因组数据,从中发现潜在的疾病风险因素。
这种方法可以帮助医生在疾病的早期阶段做出诊断,并采取预防措施。例如,通过分析乳腺癌患者的BRCA1和BRCA2基因突变,可以预测其患病风险,从而进行早期筛查和干预。
如今,EvolutionaryScale正站在生物学与人工智能融合的前沿,通过不断创新和探索,致力于实现生物系统的编程和优化。后续或将实现更多技术性的突破,为人类开创一个更加智能和健康的未来。
参考链接:
1.https://www.evolutionaryscale.ai/
2.https://www.forbes.com/sites/kenrickcai/2023/08/25/evolutionaryscale-ai-biotech-startup-meta-researchers-funding/
3.https://www.businesswire.com/news/home/20240625717839/en/EvolutionaryScale-Launches-with-ESM3-A-Milestone-AI-Model-for-Biology
【声明】:未经允许严禁转载,如需转载请联系我们,文章版权和最终解释权归元宇宙之心所有。
来源:金色财经