4 月 25 日, 以“模型的世界, 应用的天下”为主题的 Create 2025 百度 AI 开发者大会在湖北武汉召开。会上, 百度集团执行副总裁、百度智能云事业群总裁沈抖分享了百度智能云在智能基础设施建设方面的最新成果, 并在算力、模型及应用等方面发布一系列全新产品。
大模型的高效落地亟需从底层算力到应用的全栈、系统级支撑 —— 既需高性能硬件与集群优化, 也需灵活的开发工具链与场景化解决方案。基于多年在大模型研发与产业落地的深厚积累, 百度智能云构建了新一代系统级智能基础设施, 为企业大模型应用落地提供最佳解决方案。
相关数据显示,2024 全年百度智能云在大模型相关中标项目数、行业覆盖数、央国企中标项目数三个维度均为第一, 在能源、政务、金融三个行业的中标项目数位于所有厂商第一。截止目前, 千帆平台企业用户数量超 40 万, 千帆平台组件数量超 1000 个, 企业在千帆平台上已开发出了超 100 万个应用。
沈抖表示, 系统的价值, 不仅是解决某一个问题, 而是让企业拥有创造“创造的能力”。企业可以结合自己的数据、流程、逻辑, 利用百度智能云的系统级能力打造企业专属 AI 基础设施。
百舸 + 昆仑芯超节点: 推理性能提升 13 倍、成本降低 95%
算力是 AI 时代的“新电力”。百度智能云通过自研昆仑芯 P800 芯片及百舸大规模推理加速能力, 实现算力性能与成本的双重突破。
本次大会, 百度正式点亮了昆仑芯 P800 的三万卡集群。在金融行业, 招商银行与百度智能云基于昆仑芯 P800 展开算力合作, 能稳定支持各类开源大模型, 性能表现卓越, 在智能客服、多模态数据分析等场景实现了显著效能提升。目前, 除了招商银行这类金融机构, 昆仑芯 P800 算力已在国家电网、中国钢研等央企, 同济大学、北京大学等高校及一批互联网企业进行规模化部署。
为了进一步降低算力使用成本, 百度智能云正式发布昆仑芯超节点。
昆仑芯超节点支持把 64 张昆仑芯 AI 加速卡放到同一个机柜, 实现单节点的超强性能, 一个机柜就能顶过去 100 台机器。与以往的方案相比, 昆仑芯超节点用更快的机内通信替代机间通信, 可以有效降低带宽成本, 最终实现卡间互联带宽提升 8 倍, 单机训练性能提升 10 倍, 单卡推理性能提升 13 倍。
仅仅拥有高性能芯片和大规模集群是远远不够的, 如何稳定、高效地释放算力的真正价值才是关键所在。沈抖认为, 未来三年, 推理降本, 一定是企业最重要的工作。
百度智能云全面升级百舸推理加速能力。通过大规模分布式推理的 PD 分离, 百舸支持客户根据不同场景的业务特点, 自适应地设置 PD 配比, 并做到 token 级别的 PD 负载均衡。针对 MOE 模型, 百舸做到了大规模多机专家并行的极致优化, 可以大幅降低 MOE 模型推理的通信开销。最后, 百舸对核心链路上的每一个细节做了系统级的工程优化, 大幅提升 GPU 的有效利用率。
从百度内部实践来看, 百舸推理加速的能力正在作为千帆的算力底座, 为 40 万客户提供服务。上线以来, 千帆的推理吞吐提升 20 倍, 推理速度提升 50% 以上。在外部, 百舸不止支持着像招商银行、中国石化、长安汽车等企业的超大规模算力需求, 也很好地支撑着创企客户、伙伴的模型训练、推理需求。
以北京人形机器人创新中心为例, 百度百舸为创新中心构建了稳定的超大算力集群, 确保具身模型的训练和推理得以高效进行, 支持了人形机器人的快速迭代。在近日全球首个人形机器人半程马拉松中, 北京人形机器人创新中心旗下纯电驱全尺寸人形机器人“天工”, 以 2 小时 40 分 42 秒的成绩率先冲线一举夺冠。
为企业应用开发提效! 千帆发布智能体 Pro 及 MCP 服务
企业部署大模型, 不仅需要高性价比的模型服务, 更需要全面的模型工具。在模型服务层面, 目前千帆平台上有超过 100 多个模型, 不仅包括文心 4.5Turbo、文心 X1 Turbo 等百度自研模型, 还包括 DeepSeek、Ilama、Vidu 等第三方模型, 服务稳定、可靠。在模型开发层面, 千帆平台可以提供全面的模型开发工具链, 支持深度思考模型、多模态模型的定制、精调。
以模型蒸馏为例, 智联招聘在人岗匹配场景使用了千帆平台的模型蒸馏工具链, 用千亿参数的 DeepSeek R1 作为“教师模型”, 用百亿参数的 ERNIE Speed 作为“学生模型”, 经过调优后的小参数模型, 不仅可以媲美“教师模型”的效果, 成本也降低至 3 成。
在应用开发上, 本次大会千帆平台全面升级了企业级 Agent 开发工具链, 发布了全新推理式智能体 —— 智能体 Pro, 从快问快答升级到深思熟虑, 并且支持每个企业定制自己的专属智能体。以污水宝为例, 基于千帆 Agentic RAG 能力, 让 Agent 结合企业自己的私域数据和企业知识库, 可以基于对任务的理解去制定检索策略, 大幅降低模型幻觉。同时, 智能体 Pro 也支持 Deep Research 深度研究模式, 能让 Agent 自主完成复杂任务的步骤规划、信息筛选和整理, 支持像人一样操控电脑浏览网页 (computer use) 进行探索式知识收集, 也支持像人一样使用多种工具绘制图标、撰写, 生成结构清晰、内容丰富的专业报告。
基于 DeepResearch 能力, 荣耀正在利用千帆平台, 面向高校学生、职场白领等群体, 打造一款科研场景深度研究的应用, 将很快会在荣耀笔记本上上线。
MCP 的出现, 帮助开发者和企业在开发 Agent 时, 能够更好地利用行业数据和工具。本次大会, 百度智能云正式发布国内首个企业级 MCP 服务, 第一批已经有超过 1000 个 MCP Servers 供企业及开发者灵活选择。另外, 开发者也可以在千帆上开发自己的 MCP Server, 并发布到 MCP 广场, 支持免费托管, 而且百度搜索也会索引这些 MCP Server, 让它们被更多的开发者引用。
从模型服务到应用开发, 企业客户已经在千帆平台上做出了很多行业创新。民生银行与百度智能云合作, 探索大模型在商业银行的落地, 完成了金融领域第一个端到端涵盖算力、平台、模型、应用四层架构的项目落地。
自研 AI 应用重磅升级: 实现营销全旅程服务, 视觉 AI 应用成本大幅下降
百度智能云打造的智能基础设施也支撑着百度自己的应用创新。本次大会, 百度智能云面向智能营销、视觉 AI 两大领域, 升级了两大自研 AI 应用产品。
金融营销场景需要高精准获客、“高情商”客服及高效的流失预警, 百度智能云本次升级发布客悦・ONE, 在上述核心场景进行了全面优化, 为客户提供全生命周期智能营销服务, 助力企业实现营销效能全面提升。
以理财撤单场景为例, 传统模式下, 用户需经历复杂的说明阅读和多层级菜单操作, 效率低下。客悦通过 AI 驱动的智能交互, 极大简化了这一流程。AI 不仅能识别并安抚用户焦虑, 更能在对话中直接引导解决问题, 还能自动提炼关键信息并回流数据, 持续优化服务体验。
目前客悦已经服务银行、证券、保险等不同细分领域的金融企业 50 余家, 落地金融行业 10 余个场景。
为了解决视觉 AI 模型训练周期长、门槛高, 需要大量人工干预的问题。百度智能云升级发布一见 5.0, 在标准化高、规则清晰的任务中, 仅需一句自然语言, 即可秒级生成专业级视觉 AI 应用, 一线业务人员也能轻松上手, 借助云边协同, 应用成本大幅降低, 加速了视觉智能规模化的落地。
目前, 百度智能云从算力、平台到应用的系统级能力, 已经在多个企业场景中稳定运行。中国钢研与百度智能云联合打造全栈智能基础设施, 基于昆仑芯和百舸, 搭建了专属的智算平台; 在千帆上做模型精调, 使用大、小模型结合的方式获得最佳效果; 结合一见视觉平台, 快速完成了表面缺陷检测、金相分析等核心场景的应用开发。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。