人工智能能否改变我们发现新药的方式

发布时间:2022-11-29 19:39:13 栏目:生活

    导读 世界人口老龄化、慢性病和传染病负担日益加重以及新型病原体的出现,使得对新疗法的需求更加紧迫。然而,发现一种新药并将其推向市场是一个

    世界人口老龄化、慢性病和传染病负担日益加重以及新型病原体的出现,使得对新疗法的需求更加紧迫。然而,发现一种新药并将其推向市场是一个漫长、艰巨和昂贵的旅程,其特点是失败很多,成功很少。

    长期以来,人工智能一直被认为是克服其中一些障碍的答案,因为它能够分析大量数据,发现模式和关系,并预测效果。

    但是,尽管人工智能具有巨大的潜力,但它尚未兑现改变药物发现的承诺。

    现在,由哈佛医学院生物医学信息学家Marinka Zitnik领导的多机构团队推出了一个平台,旨在通过开发更现实的数据集和更高保真度的算法来优化人工智能驱动的药物发现。

    Therapeutics Data Commons,在Nature Chemical Biology最近的一篇评论中有所描述,它是一个开放获取的平台,作为计算机科学家和机器学习研究人员与生物医学研究人员,生物化学家,临床研究人员和药物设计师之间的桥梁 - 传统上彼此隔离工作的社区。

    该平台为多种治疗方式(包括小分子药物、抗体以及细胞和基因疗法)提供数据集管理、算法设计和性能评估,涵盖从化合物鉴定到临床试验药物性能的所有阶段。

    她最近与《哈佛医学新闻》讨论了治疗数据共享。

    HMNews:药物发现中的核心挑战是什么,人工智能如何帮助解决这些问题?

    Zitnik:从零开始开发一种既安全又有效的药物是非常具有挑战性的。平均而言,这需要11至16年的时间,在10亿至20亿美元之间。为什么?

    很难及早弄清楚一种最初有希望的化合物是否会在人类患者中产生与实验室中显示的结果一致的结果。小分子化合物的数量是10的60次方 - 然而在这个天文数字庞大的化学空间中,只有一小部分被寻找具有药用特性的分子。尽管如此,现有疗法对治疗疾病的影响是惊人的。我们相信,新颖的算法与自动化和新的数据集相结合,可以找到更多的分子,可以转化为改善人类健康。

    人工智能算法可以帮助我们确定这些分子中哪些最有可能是安全有效的人类疗法。这是药物发现开发面临的终极问题。我们的愿景是,机器学习模型可以帮助筛选和整合大量的生化数据,我们可以更直接地与分子和遗传信息联系起来,并最终获得个性化的患者结果。

    HMNews:人工智能离实现这一承诺有多近?

    齐特尼克:我们还没有到那一步。有许多挑战,但我想说最大的挑战是了解我们当前的算法工作得如何,以及它们的性能是否转化为现实世界的问题。

    当我们通过计算机建模评估新的人工智能模型时,我们正在基准数据集上测试它们。我们越来越多地在出版物中看到这些模型正在达到近乎完美的精度。如果是这样的话,为什么我们没有看到机器学习在药物发现中的广泛应用?

    这是因为在基准数据集上表现良好与准备在生物医学或临床环境中过渡到实际实施之间存在很大差距。训练和测试这些模型的数据并不表示这些模型在实际实践中使用时会面临什么样的挑战,因此缩小这一差距非常重要。

    HMNews:Therapeutics Data Commons平台从何而来?

    齐特尼克:Therapeutics Data Commons的目标是解决这些挑战。它一端是机器学习社区和另一端生物医学社区之间的交汇点。它可以帮助机器学习社区进行算法创新,并使这些模型更容易转化为现实世界的场景。

    HMNews:你能解释一下它是如何工作的吗?

    齐特尼克:首先,请记住,药物发现的过程涵盖了从基于化学和化学生物学数据的初始药物设计,到基于动物研究数据的临床前研究,一直到人类患者的临床研究。作为平台的一部分,我们训练和评估的机器学习模型使用不同类型的数据来支持所有这些不同阶段的开发过程。

    例如,支持小分子药物设计的机器学习模型通常依赖于分子图的大型数据集 - 化合物的结构及其分子特性。这些模型在已知的化学空间中发现了将化学结构的某些部分与药物安全性和有效性所需的化学性质相关联的模式。

    一旦人工智能模型被训练来识别已知化学物质子集中的这些指示模式,它就可以被部署,并且可以在尚未测试的化学品的大量数据集中寻找相同的模式,并预测这些化学物质的性能。

    为了设计有助于后期药物发现的模型,我们根据动物研究的数据对其进行训练。这些模型经过训练,以寻找将生物数据与人类可能的临床结果相关联的模式。

    我们还可以询问模型是否可以在与患者信息相关的化合物中寻找分子特征,以确定哪个患者子集最有可能对化合物做出反应。

    HMNews:谁是这个平台的贡献者和最终用户?

    齐特尼克:我们拥有一支由学生、科学家和专家志愿者组成的团队,他们来自合作大学和工业界,包括波士顿地区的小型初创企业以及美国和欧洲的一些大型制药公司。计算机科学家和生物医学研究人员以最先进的机器学习模型以及预处理和策划数据集的形式贡献他们的专业知识,这些数据集以可以发布并可供其他人使用的方式进行标准化。

    因此,该平台包含可用于分析的数据集和机器学习算法,以及告诉我们机器学习模型在特定数据集上表现如何的稳健措施。

    我们的最终用户是来自世界各地的研究人员。我们组织网络研讨会来展示任何新功能、接收反馈并回答问题。我们提供教程。这种持续的培训和反馈非常重要。

    我们每月有 4,000 到 5,000 名活跃用户,其中大部分来自美国、欧洲和亚洲。总体而言,我们的机器学习算法/数据集包的下载量已超过 65,000 次。我们已经看到超过160,000次下载统一的标准化数据集。这些数字正在增长,我们希望它们将继续增长。

    HMNews:治疗数据共享的长期目标是什么?

    Zitnik:我们的使命是在两个方面支持人工智能药物的发现。首先,在药物发现和开发的所有阶段设计和测试机器学习方法,从化合物鉴定和药物设计到临床研究。

    其次,支持跨多种治疗方式的机器学习算法的设计和验证,尤其是较新的算法,包括生物制品、疫苗、抗体、mRNA药物、蛋白质疗法和基因疗法。

    机器学习有巨大的机会为这些新疗法做出贡献,我们还没有看到人工智能在这些领域的使用,就像我们在小分子研究中看到的那样,而今天大部分的焦点都是如此。这种差距主要是由于缺乏针对这些新型治疗方式的标准化人工智能就绪数据集,我们希望通过治疗数据共享来解决这一问题。

    HMNews:是什么激发了你对这项工作的兴趣?

    齐特尼克:我一直对理解和建模复杂系统之间的交互感兴趣,这些系统是具有多个组件的系统,这些组件以非依赖的方式相互作用。事实证明,根据定义,治疗科学中的许多问题正是如此复杂的系统。

    我们有一个复杂的三维结构的蛋白质靶标,我们有一个小分子化合物,它是原子和这些原子之间键的复杂图,然后我们有一个病人,他的描述和健康状况以多尺度表示的形式给出。这是一个典型的复杂系统问题,我真的很喜欢寻找和找到标准化和“驯服”这些复杂交互的方法。

    治疗科学充满了那些已经成熟到可以从机器学习中受益的问题。这就是我们所追逐的,这就是我们所追求的。

免责声明:本文由用户上传,如有侵权请联系删除!