AI co-scientist 系统基于 Gemini 2.0 开发,能够协助科研人员生成新的研究假设、制定实验方案,并通过自我改进提升结果质量。在生物医学应用中,AI co-scientist 成功预测了药物再利用方向、提出新的治疗靶点,并解释了抗菌耐药机制。
在科学探索的过程中,研究人员需要对以往发表的文献进行观察总结,提出一些新颖、可行的研究方向,最后通过全面的实验进行 idea 验证。
科研人员需要对探索的宽度和深度进行平衡,由于精力有限,不能探索过多的研究方向,同时还要保证对目标主题的研究深度。
最近,谷歌、斯坦福大学等机构的研究人员开发了一个多智能体、基于 Gemini 2.0 的 AI 协同科研(AI co-scientist)系统,具备跨复杂主题的综合能力和进行长期规划、推理的能力,除了传统的文献综述、总结功能之外,还可以辅助科研人员提出新的、原创知识,或是基于先前的成果制定研究假设 (hypotheses) 和计划 (proposal)。
论文链接:https://storage.googleapis.com/coscientist_paper/ai_coscientist.pdf
AI co-scientist 系统的输入为一段用自然语言描述的研究目标,输出为全新的研究假设、详细的研究概述和实验方案。
根据科研活动本身的特性,开发者设计了多个专用智能体用来「生成、反思、排名、进化、邻近性检查、元审查(meta review)」,使用自动反馈信号来迭代生成、评估和改进假设,构成了一个自我修正、改进的循环机制,逐步生成质量更高、创新性更好的假设。
系统的核心思路就是「协助科研」,所以开发者设计了多种方式让研究人员与系统进行互动,比如「直接提供种子想法」进行探索或是对生成的结果提供「自然语言反馈」。
系统还用到了外部工具,如网络搜索和专用 AI 模型,以增强生成假设的依据和质量。
AI co-scientist 将分配的目标解析为研究计划配置,由监督智能体(supervisor agent)负责将专用智能体分配到工作队列并分配资源,使得系统能够灵活扩展计算能力,并迭代地提高其科学推理能力,以实现指定的研究目标。
测试时计算(test-time compute)
AI co-scientist 使用「测试时计算」技术来迭代推理、进化和改进输出,如进行自我对弈(self-play)科学辩论以生成新假设,对所有假设进行质量排名对比,或是不断进化假设等,可以让智能体不断进行自我批评,使用工具进行反馈以细化假设和提案。
论文链接:https://arxiv.org/ abs / 2408.03314
系统的自我提升能力主要依赖于 Elo 自动评估指标,通过对模型的输出进行对比竞赛,最终可以得到一个 Elo 值,研究人员分析了 Elo 自动评级与 GPQA 中 diamond set(有难度的问题集合)准确率的匹配度,结果发现 Elo 评级与输出质量呈正相关。
AI co-scientist(蓝色线)和 Gemini 2.0(红色线)的平均准确率对比,按 Elo 评级分组
七位领域专家在其专业领域内精心挑选了 15 个开放研究目标和最佳解决方案,使用自动化的 Elo 指标,结果发现 AI co-scientist 在复杂问题上的表现优于其他最先进的智能体和推理模型。
随着系统在推理和改进上花费更多时间,结果的自我评估质量提高,并超越了模型和无助的人类专家。
结果也验证了「使用从科学方法中归纳出的先验知识」进行「测试时计算」扩展的优势:系统在推理和改进上花费的时间越多,结果的自我评估质量越高,最终超越了其他模型和人类专家。
AI co-scientist 的性能会随着系统在计算上花费时间更多而逐步提高
在 11 个研究目标的小子集上,专家们评估了 AI co-scientist 生成结果相对于其他基线模型在新颖性(novelty)和影响潜力(impact)的总体偏好,虽然样本量较小,但专家们普遍认为 AI co-scientist 更受欢迎,与之前引入的 Elo 自动评估指标一致。
真实场景应用
药物再利用治疗急性髓系白血病
药物研发是一个耗时且昂贵的流程,新的治疗方法需要重新启动发现和开发流程,以治疗不同的适应症或疾病。
药物再利用(drug repurposing)通过发现现有药物超出其原始预期用途的新治疗应用来克服该难题,但由于任务复杂,需要广泛的跨学科专业知识。
研究人员使用 AI co-scientist 来辅助预测潜在的药物再利用研究方向,模型提出了针对急性髓系白血病(AML)全新的、可再利用的候选药物,随后与合作团队通过计算生物学、专家临床医生反馈和体外实验验证了模型的预测结果,证实该药物在多个 AML 细胞系中,在临床相关浓度下能够抑制肿瘤活力。
三种新型 AI 合科学家预测的 AML 再利用药物之一的有效剂量反应曲线;KIRA6 在临床相关浓度下抑制 KG-1(AML 细胞系)的存活,能够在较低药物浓度下降低癌细胞存活,减少了脱靶副作用的可能性
推进肝纤维化目标发现
识别新型治疗靶点比药物再利用更复杂,通常会导致假设选择效率低下、体外及体内实验优先级排序不当。人工智能辅助靶点发现有助于简化实验验证过程,降低开发时间成本。
AI co-scientist 通过识别基于临床前证据并具有显著抗纤维化活性的表观遗传学靶点(3D、多细胞组织培养,由人类细胞衍生并设计来模拟人类肝脏的结构和功能),展现了其在提出、排序和生成针对发现假设的假设和实验方案方面的潜力,相关报告即将与合作者斯坦福大学共同发布。
AI co-scientist 建议的治疗方案与纤维化诱导剂(阴性对照)和抑制剂(阳性对照)的治疗效果对比
解释抗菌药物耐药机制
研究人员指示 AI co-scientist 探索小组内已经进行过新颖发现但尚未公开的课题,解释囊膜形成噬菌体诱导的染色体岛(cf-PICIs)如何在多种细菌物种中存在?
「微生物进化出的抵抗感染治疗药物的机制」涉及到理解基因转移(接合、转导和转化)的分子机制,以及推动抗菌药物耐药性(AMR)基因传播的生态和进化压力。
AI co-scientist 系统独立提出,cf-PICIs 与多种噬菌体尾部相互作用以扩大宿主范围,在之前进行的实验中得到了验证,进一步说明 AI co-scientist 作为辅助技术的价值,能够利用数十年前的研究结果。
AI co-scientist 重新发现新型基因转移机制的时间线。蓝色:cf-PICI 发现实验研究流程时间线。红色:AI co-scientist 在没有先验知识的情况下发展和重现这些关键发现
参考资料:
https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/
本文来自微信公众号:新智元(ID:AI_era)
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。