近日,蒙纳士大学的科学家们取得重大突破,解开了免疫医学的最大问题之一:如何在分子水平上准确预测哪些T细胞及其受体能够起到预防疾病的作用。
来自蒙纳士大学生物医学发现研究所(BDI)的团队在跟上海交通大学和耶鲁大学的合作中,使用了定制的 artificial intelligence人工智能(AI)模型,进一步加速了对个性化细胞和遗传医学的探索。
T细胞受体是解谜的关键线索之一,科学家称之为TCR。它是一种蛋白质网络,当检测到抗原(如细菌或病毒,或任何“有毒物质”)时,会激发细胞活力,从而引发免疫反应。
迄今为止,研究面临的最大问题是:TCR的种类繁多,抗原内与受体结合的抗原决定基也同样种类繁多。
这项研究现发表在《自然》(Nature)的子刊《机器智能》(Machine Intelligence)上。主要资深作者是Jiangning Song教授,他是BDI人工智能驱动的生物信息学和生物医学实验室的负责人。他解释说,了解T细胞如何识别抗原,对于开发更好的疫苗、免疫疗法以及治疗癌症、自身免疫性疾病和传染病都是至关重要的。
Song教授是蒙纳士数据未来研究所、澳大利亚研究理事会的高级分子影像学卓越中心、蒙纳士数字健康联盟的成员,他的研究范围横跨生物医学和计算机科学。
EPACT的影响
该团队在论文引言中说,尽管“进行了广泛的研究”,预测TCR和抗原的结合对仍然是一个重大挑战,名为EPACT的AI深度学习工具在其中功不可没,成功地观察到了抗原和特定CD8+ T细胞的抗原决定基。CD8+细胞可以对病毒和细菌进行免疫防御,并运用到肿瘤监测中,杀死被感染的细胞。
研究人员将AI方法应用于冠状病毒SARS-CoV-2时,相关T细胞所预测的结合强度与疫苗接种后的免疫反应一致。T细胞受体通过MHC第1类分子所显示的特定抗原激活了细胞。
Song教授说:“这个特殊项目的一个主要特点是,我们需要处理海量的高维多模态生物医学数据集。数据集来自测序数据、单细胞转录组数据、3D结构数据、交互数据。最终,我们需要思考的是:如何找到一种更好的方法,帮助我们更好地理解这类数据。我们真的能把AI用在探索未知领域上吗?比方说,把这些数据转化为可编译的材料。”
专用的AI模型
在这类科学研究中,有一个问题是不可忽视的,那就是Song教授所说的:涵盖广泛的细胞测序数据与新兴AI工具中载入的日益昂贵的3D细胞结构数据之间“不断扩大的鸿沟”。将TCR序列数据映射到抗原特异性的实验方法中面临多个问题,包括成本高、技术复杂和覆盖范围有限。由于缺乏高质量的数据,用现有计算方法预测与TCR绑定的未知抗原决定基存在着一定的困难。
“正因为如此,我们合作开发了一个更专业、更有针对性的AI模型,并发表在这篇论文中。”他说,“这只是开发更好的AI方法的第一步,希望这些AI工具能够帮助研究人员设计出更安全、更有效、更高效的T细胞受体,实现个性化免疫治疗,比如,从预测性AI到生成性AI。这是一个长期的目标。”
该研究的主要发现之一是能够处理T细胞残留基与抗原决定基之间的相互作用。“这是一个关键性的进展。”他说,“之前我们试过很多方法,都无法预测残留水平的相互作用,并精确定位和识别关键的残留基,这些关键残留基不仅负责结合的密切程度,也决定着交叉反应的状况。我们的模型可以实现进一步开发利用,未来将用于指导模拟决定基的相关疫苗的生产。”
揭示“多尺度”相互作用
他说,从这类长期而复杂的分子研究中,一个AI模型如今终于诞生了。这是一个重要发现,它可以显示T细胞、细胞中的分子和决定基中的肽之间的“多尺度”相互作用。
“它还可以识别抗原特异性T细胞簇,证实接种疫苗后的SARS-CoV-2刺突特异性T细胞的反应情况。”
Yumeng Zhang是本研究的第一作者,也是Song教授在BDI实验室的博士生,是他实现了这个AI模型。“我们的模型还可以扩展到识别有免疫性的新抗原,并设计个性化生物标记。”
Song教授说,该研究团队开发的AI模型是一个“强大的计算工具,具有巨大的潜力,可以被应用于加快临床研究中基于TCR的免疫疗法和疫苗的评估”。