在人工智能技术与生命科学深度融合的浪潮下,亦康(北京)医药科技有限公司(以下简称“亦康医药”)与超擎数智达成深度合作,通过超擎数智提供的基于 AI 算力集群 + AI Engine 人工智能开发平台的 AI 整体解决方案,成功将癌症药物研发效率提升至新高度,为医疗健康和生命科学领域突破性研究注入强劲动能。
一、癌症治疗与新药研发的困境和需求
癌症治疗经历了三个关键阶段,每一次进步都显著提升了患者的生存率和治疗精准度。
传统化疗利用细胞毒性药物杀死快速分裂的癌细胞,但副作用较大,容易伤害健康细胞;
靶向药物通过靶向特定的致癌基因或蛋白,如 EGFR 或 HER2,精准干预癌细胞生长信号。然而,癌细胞基因突变可能导致耐药性问题;
免疫治疗通过激活人体免疫系统,由 T 细胞(免疫细胞的一种)识别并消灭癌细胞。其中 T 细胞受体(TCR)需要精准识别癌细胞抗原,但由于抗原多样性及个体基因差异,TCR 识别的有效性仍有提升空间。
T 细胞通过 TCR(T 细胞受体)识别癌细胞抗原,但 TCR-抗原匹配是一个复杂的生物信息学问题。传统实验方法或人为分析匹配 TCR 和癌细胞抗原难度极大:人类免疫系统的 TCR 种类极其庞大,以适应各种不同病毒的抗原,这种极大的多样性使得人工匹配近乎不可能;癌细胞可能表达数千种突变蛋白,每种蛋白可包含多个潜在的抗原位点,识别最具免疫原性的抗原是个挑战;TCR 与抗原肽的结合依赖于氨基酸序列、空间结构、分子间相互作用,人工难以直接预测哪种组合最优。
随着科学技术的不断进步,通过整合化疗、靶向药物治疗、免疫治疗等多种治疗手段,以及借助基因检测、生物信息学等前沿技术,有望进一步提高癌症治疗的效果。基于 Transformer 的大模型成为解决 TCR-抗原匹配问题,实现癌症药物研发的最佳方案。TCR 和抗原均由氨基酸组成,其相互作用类似于自然语言处理(NLP)任务中的文本匹配,同时氨基酸序列的上下文信息极其重要,TCR 识别不仅依赖于单个氨基酸,而是基于整个序列的结构和相互作用模式,Transformer 架构正好满足上述需求。
二、超擎数智 × 亦康医药:新药研发的 AI 新范式
亦康医药位于北京经济技术开发区,致力于药物的体外生物活性筛选和功能验证、临床前体外、体内药理药效学评价及药物临床转化研究,以药理学、免疫学、病理学和创新药物开发的知识和技术体系为核心,针对进入临床实验的创新药物开展伴随临床实验的生物标本检测及预测疗效的生物标志物开发,践行精准治疗。
过去,药物研发过程中,蛋白质三维结构分析是一个极其昂贵且耗时的环节。为了精准解析蛋白质的空间构象,研究机构通常依赖冷冻电镜、X 射线晶体衍射等高精度成像技术。然而,这些传统方法不仅设备昂贵,而且实验周期长,严重制约了新药的研发进度。
亦康医药作为专业从事生物医药研发外包服务和疾病精准治疗的国家高新技术企业,在业务发展过程中,面临 AI 技术创新资源不足、海量数据计算与复杂模型迭代效率低等挑战。
超擎数智基于对生物医药行业痛点的深刻洞察,为亦康医药量身打造了“软硬一体”的 AI 解决方案,助力亦康医药大幅提升 TCR 识别癌细胞抗原的精准度,为抗癌药物和抗癌疫苗研发提速。亦康医药通过部署、使用超擎数智 AI Engine 人工智能开发平台,采用 Transformer 架构,成功研发了亦康医药生物大模型,通过精准的 TCR 识别和强大的数据处理能力,能够加速抗癌药物和疫苗的研发进程,显著提高研发效率,不仅提升了亦康医药在生物医学领域的竞争力,也为整个行业的发展提供了新的思路和技术支持。
同时,亦康医药通过超擎 AI Engine 人工智能开发平台,轻松实现 AI 集群的高效管理:
智能集群管理:实时监控 GPU 使用率、显存占用、网络流量,提升计算资源利用率。
算力动态调度:基于 AI 任务需求,智能分配计算资源,避免资源浪费。
全生命周期管理:支持 AI 计算集群的部署、运行、维护,保障高效稳定运行。
超擎数智为亦康医药设计部署高性能 AI 集群与无损 AI 网络,通过强大的 AI 基础设施,赋能亦康医药业务发展。亦康医疗的 AI 计算集群采用 12 台 8 卡 GPU 服务器,构建高性能计算平台,支撑大规模 AI 模型训练,AI 网络层面架构构成如下:
计算网络:基于 Infiniband MQM9700 交换机,提供高带宽、低延迟的 AI 训练通信。
存储网络:基于 Infiniband MQM8700 交换机,加速大规模数据加载,支撑 AI 训练。
管理网络:采用以太网进行机器带内带外管理。
三、系统性创新,高效完成亦康医药项目交付
在为期四天的项目交付周期中,超擎技术团队面对传统机房改造、计算效能瓶颈及医疗健康数据合规三重挑战,实施全栈式优化方案,通过系统性技术创新,成功为亦康医药构建支撑新药研发的 AI 算力基座,实现项目的快速部署与高效运行。
针对原有机房纯风冷设计难以满足高密度 GPU 服务器对散热的需求,为确保设备稳定运行,超擎技术团队结合机房现有条件,对机房散热进行了改造优化,通过调整气流组织,优化风道布局,增加了高效散热方案,使得 PUE(电源使用效率)值维持在合理范围内,提升了整体能效比。同时,采用精密空调等高效风冷技术,优化服务器机柜的布局,确保冷风均匀覆盖计算节点,同时增强机房通风能力,以满足长期稳定运行的要求。
在计算架构层面,为了进一步提高训练效率,超擎技术团队采用了 FP8 混合精度训练引擎,大幅减少计算过程中的显存占用,同时提升训练吞吐量。这一优化方案不仅提升了训练速度,还降低了能耗,使 AI 集群在计算能力和能源效率之间达到了最佳平衡。
尤为关键的是,生物医药领域对数据安全要求极为严格,尤其是病患基因数据、临床试验数据,须满足法律法规合规性要求。在项目交付过程中,超擎技术团队采用端到端加密、访问控制策略,并在 AI 计算集群内部署了专用隔离网络,确保数据不出域。此外,特别设计的本地化存储方案,结合 Infiniband 网络加速数据传输,既满足安全要求,又确保高效计算,实现从数据接入、计算到存储的全生命周期防护。
在 AI 训练过程中,数据传输延迟会极大影响模型训练效率。超擎技术团队通过优化 Infiniband 网络拓扑结构,并启用 SHARP 技术(Scalable Hierarchical Aggregation and Reduction Protocol),减少 GPU 间梯度传输的带宽消耗,实现跨节点的低延迟 All-Reduce,最终让大模型训练效率提升 35%。
四、赋能新药研发实现跨越式效能跃升
通过超擎技术团队的创新和努力,本次交付成果显著。亦康医药经过超擎数智 AI 整体解决方案赋能后,结合 Transformer 大模型,采用深度学习 + 生物计算的方法,癌症新药研发周期从 36 个月压缩至 6 个月,成本降低 67%,AI 训练后的模型可以在数小时甚至数分钟内解析蛋白质三维结构,相较于传统实验方法,效率提升了千倍,在关键研发环节实现突破性进展。超擎数智“AI + 医疗”技术路径已形成可复制的行业解决方案,助推 AI for Science 研究进入新阶段。
“超擎数智的 AI 解决方案不仅为亦康医药提供了核心技术升级,更助力亦康医药实现了一场医药研发范式的变革。”亦康医药创始人许春萍博士说,“过去需要跨部门长时间协作的分析任务,如今通过 AI 平台即可快速高效完成,亦康医药团队得以聚焦更具创新性的疗法设计。”
对于亦康医药与超擎数智的成功携手合作,超擎数智总经理唐春峰表示:“与亦康医药的深度合作,是超擎数智以 AI 赋能产业革新的重要里程碑。通过打造灵活、高效的算力底座与智能化工具链,我们助力亦康医药将前沿算法与生物学洞见快速转化为临床价值,这不仅验证了技术方案的行业适配性,更让我们看到 AI 驱动生命科学创新的无限可能。
此次合作,标志着超擎数智“AI + 医疗健康”垂直场景应用的又一标杆项目落地。超擎数智致力于将 AI 基础设施与行业 Know-How 深度融合,让医药企业用好 AI,为中国生物医药产业智能化转型提供可复制的路径。未来,超擎数智将持续深耕 AI 垂直场景建设,以创新的技术方案和敏捷的交付能力,与亦康医药等创新伙伴并肩前行。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。