立足行业客户核心诉求，浪潮计算机发布基于 DeepSeek 模型的“推理一体机”

2025/2/13 17:24:51 来源：之家网站作者：- 责编：-

评论：

近日，国内 AI 初创公司 DeepSeek 连续发布基座模型 DeepSeekV3、推理模型 R1、多模态模型 Janus-Pro 三款大模型，引发了国内外市场的强烈反响。DeepSeek 在大幅降低成本的同时，保证了大模型的高性能推理能力，更为利好的是，DeepSeek 同步开源模型权重，为国内 AI 产业链发展带来了新的机遇。

在 AI 大模型加速落地的今天，金融、通信、能交、制造等行业头部企业纷纷将目光投向本地化部署，希望通过私有化大模型确保数据安全高效运转，实现与业务的深度适配。然而，从算力选型到模型优化，从集群管理到场景适配，每一步都暗藏技术挑战。一方面，传统解耦架构的 AI 集群与国内 AI 算力对闭源模型适配性不足，难以满足企业持续迭代需求。另一方面，开源框架与硬件调优依赖人工经验，分布式训练资源调度效率偏低。如何在保障数据及合规安全的前提下，以更低成本、更高效率实现大模型从部署到落地的全流程闭环？成为大模型本地化时代下各行业客户的核心诉求。

浪潮计算机快速响应大模型开源生态，联合国内 AI 算力厂商，推出基于 DeepSeek 模型的“推理一体机”，以“软硬协同”的完整方案，帮助企业摆脱复杂部署难题，实现 DeepSeek 全系列模型“即插即用”和大模型本地化，助力生产力有效转换。

立足行业客户核心诉求，浪潮计算机发布基于 DeepSeek 模型的“推理一体机”

浪潮计算机“推理一体机”

全模型软硬件革新：“推理一体机”解决方案

作为面向大模型场景设计的旗舰级产品，浪潮创新技术服务器 NF5468H7 深度融合 DeepSeek 全系列模型与国内 AI 加速卡，打造“开箱即用”的智算解决方案：

・全模型覆盖：全面兼容 DeepSeek V3（通用底座）、R1（推理优化）、Janus Pro（多模态）等系列模型，支持智能客服与对话、文本分析、工业质检、医疗影像识别等场景快速适配。

・硬件性能跃升：搭载国内 AI 算力产品，单卡 FP16 算力达到国际主流水平，支持 FP32 / FP16 混合精度加速，单机即可完成百亿级参数模型的实时推理。

・软硬协同优化：基于国内 AI 加速卡深度定制 CUDA 兼容层，实现模型算子的定制优化，由此能够支持基于 DeepSeek 的量化及分布式推理，满足对 DeepSeek 系列多类型模型的多并发推理业务需求。

智能引擎全局协同：“推理一体机”核心优势

此次发布的“推理一体机”并非简单的“硬件堆砌”，而是通过浪潮计算机 inAIP 智能引擎实现从底层算力到上层模型的全局协同，为企业提供三大差异化价值：

・快速交付：传统大模型部署需经历硬件调试、框架适配、算子优化等漫长流程，一体机结合 inAIP 自动化配置工具，可实现低代码部署与场景化模板，即 3 小时完成从开机到推理服务上线。

・高效利用：通过对 AI 算力的智能切割与动态调度，单机可同时承载多负载实时推理、数据预处理任务。能够实现资源池化，将 8 卡 AI 加速卡集群虚拟化为多份算力单元，按需分配至不同业务线程，使硬件利用率提升至 92%。

・极简运维：提供从硬件状态到模型服务的全栈可视化管理。并支持健康自检，实时监控加速卡温度、显存占用等指标，此种预测性维护提示能够降低 30% 宕机风险。

立足行业客户核心诉求，浪潮计算机发布基于 DeepSeek 模型的“推理一体机”

浪潮计算机“推理一体机”方案架构

作为创新技术领军企业，浪潮计算机一直以来立足智算领域前沿，关注行业发展关键痛点，不断满足企业客户核心诉求。基于 DeepSeek 模型“智算一体机”的推出，标志着国内 AI 大模型进入“软硬协同、开箱即用”的新阶段。金融、能源、政府、通信、互联网等行业企业客户，均可在信息检索、知识问答、智能客服、智能风控等多重场景快速构建专属 AI 能力，在保障数据主权的同时，真正实现降本增效与业务创新！

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

下载IT之家APP，签到赚金币兑豪礼

立足行业客户核心诉求，浪潮计算机发布基于 DeepSeek 模型的“推理一体机”

相关文章