金山云在公有云场景和国资云 / 政务云场景已支持 DeepSeek-R1 / V3。
场景一公有云场景针对 DeepSeek-R1 蒸馏模型的多种镜像服务
金山云已正式发布基于 DeepSeek-R1 蒸馏模型的多种镜像服务,用户可以在金山云官网,进入“金山云控制台”免费体验。
通过金山云发布的 DeepSeek 镜像服务,用户可在公有云 GPU 云服务器、GPU 裸金属服务器分别搭建推理服务并进行调参验证。
云服务器镜像获取方式
在云服务器控制台按需选择实例规格后,在“镜像配置-镜像市场-工具软件”模块选择 DeepSeek-R1 系列的镜像创建云服务器,登录实例进行部署验证。
镜像内置 DeepSeek 模型的使用方法
vLLM 部署提供支持,适用于高性能大语言模型的推理和微调任务,支持 DeepSeek 系列模型运行。DeepSeek 模型部署推荐的实例规格配置以及详细验证方法,可参考金山云官网文档内置 DeepSeek 模型的使用方法:https://docs.ksyun.com/documents/44126?type=3
裸金属镜像获取方式
当前,金山云裸金属 GPU 系列机型均能高效支持 DeepSeek-R1 蒸馏模型快速部署,部分机型可支持 DeepSeek-R1 满血版 671B 模型的快捷使用。针对 DeepSeek 蒸馏模型提供自定义镜像,开机即用,满血版模型可通过 KS3 快速下载部署使用。
在裸金属服务器的实例规格选择界面选择合适的机型后,进入“选择镜像”步骤,选取 DeepSeek-R1 系列镜像创建裸金属服务器实例。实例创建并成功启动后即可通过远程连接工具登录到该实例验证并使用。
金山云针对 DeepSeek-R1 蒸馏模型镜像服务的适用场景及特点
适用场景:
长文档分析、多轮对话、复杂代码项目理解等。
特点:
针对长上下文场景优化,支持 32K tokens 窗口。
使用 Positional Interpolation(位置插值)技术降低长文本推理的复杂度。
提供较小尺寸的 DeepSeek 蒸馏版本模型适用于基础公有云、中小型企业内部实时部署,也方便个人用户快速搭建对话服务。
* 云服务器本次开放 1.5B、32B 两种尺寸模型镜像,其余尺寸模型镜像陆续更新中。金山云公有云自研平台推理部署模块即将接入 DeepSeek,更多国产芯片适配工作也在加速推进中。
场景二金山云国资云 / 政务云场景全面支持 DeepSeek-R1 / V3 推理服务
金山云国资云 / 政务云平台已正式上架 DeepSeek-R1 和 DeepSeek-V3 模型。通过集成金山云自研的内容安全服务,客户可实现模型安全增强与企业级高可用保障。
金山云国资云 / 政务云平台具备优异的模型推理托管能力,支持 vLLM、LMDeploy、TensorRT-LLM、SGLang 等各类主流推理框架,可实现模型的自定义导入与部署,为开发者提供了高度灵活的开发环境。目前,金山云的人工智能技术已被多个央国企采纳,显著提升了其数据处理效率。
依托国资云 / 政务云平台,金山云通过模型市场构建丰富的模型资源,同时匹配包含数据加工、模型精调、模型评估、模型量化等关键环节在内的一站式模型工具链,始终致力于为用户提供全流程、一站式的 AI 服务,助力客户在实际业务场景中深度优化模型性能。
在人工智能浪潮下,金山云将继续坚持技术立业,加速技术创新落地,携手生态企业积极拥抱时代机遇,助力行业数智化转型。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。