Google 的 Gemma AI 模型帮助发现新的潜在癌症治疗途径

作者:Shekoofeh Azizi,Google DeepMind 高级研究科学家、研究负责人;Bryan Perozzi, Google Research 高级研究科学家、图形挖掘

原文链接:blog.google/technology/ai/google-gemma-ai-cancer-therapy-discovery

今天, 作为我们与耶鲁大学研究合作的一部分,我们发布了Cell2Sentence-Scale 27B(C2S-Scale),这是一个专为理解单个细胞语言而设计的新型 270 亿参数的基础模型。C2S-Scale建立在Gemma 开放模型家族之上,代表了单细胞分析的新前沿。

这一发布标志着 AI 在科学领域的一个里程碑。C2S-Scale 生成了一个关于癌症细胞行为的新颖假设,我们已经通过活细胞实验验证证实了它的预测。这一发现揭示了开发抗癌疗法的一条充满希望的新途径。

这次发布建立在我们今年早些时候的工作基础上,当时我们证明了生物模型遵循明确的规模定律(Scaling Laws),就像自然语言一样,更大的模型在生物学上表现更好。这项工作提出了一个关键问题,更大的模型只是在现有任务上做得更好,还是能够获得全新的能力?规模定律的真正前景在于创造新想法和发现未知事物。

C2S-Scale 27B 的工作原理

癌症免疫疗法的一个主要挑战是许多肿瘤是"冷"的,对身体免疫系统不可见。使它们变"热"的一个关键策略是迫使它们通过一个称为抗原呈递(antigen presentation)的过程显示免疫触发信号。

我们给新的C2S-Scale 27B模型一个任务。找到一种充当条件放大器的药物,它只会在存在低水平干扰素(一种关键的免疫信号蛋白)但不足以单独诱导抗原呈递的特定"免疫环境阳性"环境中增强免疫信号。这需要一种条件推理水平,似乎是规模的涌现能力。我们较小的模型无法解决这种依赖于上下文的效应。

为了实现这一目标,我们设计了一个双重环境虚拟筛选来发现这种特定的协同效应。虚拟筛选包括两个阶段

  1. 免疫环境阳性:我们向模型提供具有完整肿瘤-免疫相互作用和低水平干扰素信号的真实患者样本。>
  2. 免疫环境中性:我们向模型提供没有免疫环境的孤立细胞系数据。>

然后,我们模拟了 4000 多种药物在两种环境中的效果,并要求模型预测哪些药物只会在第一种环境中增强抗原呈递,以使筛选偏向于与患者相关的设置。在模型突出显示的许多候选药物中,一小部分 (10-30%) 的药物命中已经在先前文献中已知,而其余药物是令人惊讶的命中,与筛选没有已知的先前联系。

从预测到实验验证

模型的预测很明确。它识别出激酶 CK2 抑制剂西米他塞替(silmitasertib,CX-4945) 的显著"环境分裂"。模型预测,当在"免疫环境阳性"设置中应用西米他塞替时,抗原呈递会显著增加,但在"免疫环境中性"设置中几乎没有或没有效果。使这一预测如此令人兴奋的是,它是一个新颖的想法。尽管 CK2 已被证明参与许多细胞功能,包括作为免疫系统的调节剂,但文献中尚未报道通过西米他塞替抑制 CK2 可以明确增强 MHC-I 表达或抗原呈递。这突出表明模型正在生成一个新的、可测试的假设,而不仅仅是重复已知事实。

然而,预测只有在临床应用中得到验证时才有价值。真正的测试首先在实验室中,最终在临床中进行。

在我们项目的下一阶段,我们将这个假设带到实验室工作台,并在人类神经内分泌细胞模型中进行测试——这是模型在训练期间完全未见过的细胞类型。实验证明:

  • 单独用西米他塞替处理细胞对抗原呈递(MHC-I)没有影响。
  • 单独用低剂量干扰素处理细胞有适度的效果。
  • 同时用西米他塞替和低剂量干扰素处理细胞产生了显著的协同抗原呈递放大。

值得注意的是,在我们的实验室测试中,西米他塞替和低剂量干扰素的组合使抗原呈递增加了大约 50%,这将使肿瘤对免疫系统更加可见。

模型的计算机模拟预测在体外多次得到证实。C2S-Scale 成功识别出一种新型的干扰素条件放大器,揭示了使"冷"肿瘤变"热"的新潜在途径,并可能对免疫疗法更具响应性。虽然这只是早期的第一步,但它为开发新的联合疗法提供了强大的、经实验验证的线索,这些疗法使用多种药物协同作用以获得更强大的效果。

这一结果还为新型生物发现提供了蓝图。它证明,通过遵循缩放定律并构建像 C2S-Scale 27B 这样的更大模型,我们可以创建足够强大的细胞行为预测模型,以运行高通量虚拟筛选,发现条件依赖的生物学,并生成基于生物学的假设。

耶鲁大学的团队现在正在探索这里发现的机制,并在其他免疫环境中测试其他 AI 生成的预测。通过进一步的临床前和临床验证,这些假设最终可能能够加速新疗法的开发路径。

开始使用 C2S-Scale 27B

新的 C2S-Scale 27B 模型及其资源今天已向研究社区开放。我们邀请您探索这些工具,在我们的工作基础上继续努力,帮助我们继续翻译生命的语言。