NVIDIA 今日发布能在 NVIDIA RTX™ AI PC 本地运行的基础模型,为数字人、内容创作、生产力和开发提供强大助力。
这些基础模型以 NVIDIA NIM™ 微服务的形式提供,由全新 GeForce RTX™ 50 系列 GPU 加速,提供最高可达 2375 AI TOPS 和 32GB 显存。基于 NVIDIA Blackwell 架构的 RTX 50 系列 GPU 是首批支持 FP4 计算精度的消费级 GPU。与上一代产品相比,AI 推理性能提升 2 倍,并让生成式 AI 模型在本地以更小的显存占用空间运行。
长期以来,GeForce™ 一直是 AI 开发者的重要平台。早在 2012 年,首个由 GPU 加速的深度学习网络 AlexNet 就是在 GeForce GTX 580 上进行训练的。在去年发表的 AI 研究论文中,超过 30% 都提及了对 GeForce RTX 的使用。
现如今,在生成式 AI 和 RTX AI PC 的助力下,任何人都能成为开发者。借助 AnythingLLM、 ComfyUI 和 LangFlow 等新一代低代码和无代码工具,发烧友能够通过简单的图形用户界面 (GUI) 在复杂的工作流中使用 AI 模型。
连接到这些 GUI 的 NIM 微服务使获取和部署最新生成式 AI 模型轻而易举。NVIDIA AI Blueprint 基于 NIM 微服务构建,旨在为数字人、内容创作等应用提供易于使用的预配置参考工作流。
为满足 AI 开发者和发烧友日益增长的需求,领先 PC 制造商和系统集成商即将推出搭载 GeForce RTX 50 系列 GPU 且支持 NIM 的 RTX AI PC。
NIM 提供迅捷 AI 体验
基础模型,即使用海量原始数据训练而成的神经网络,是生成式 AI 的基础模块。
NVIDIA 将发布一系列来自包括 Black Forest Labs、Meta、Mistral 和 Stability AI 等顶尖模型开发者的适用于 RTX AI PC 的 NVIDIA NIM 微服务。涵盖大语言模型 (LLM) 、视觉语言模型、图像生成、语音、检索增强生成 (RAG) 的嵌入模型、PDF 提取和计算机视觉等应用场景。
Black Forest Labs 首席执行官 Robin Rombach 表示,“支持 FP4 计算精度的 GeForce RTX 50 系列 GPU 将使一大批此前仅适用于大型数据中心的模型得以在 PC 上运行。把 Flux 打造成 NVIDIA NIM 微服务,让更多用户以更快的速度部署和体验 AI,同时提供超乎想象的性能。”
NVIDIA 今天还宣布推出 Llama Nemotron,这是一系列开放许可的基础模型,能够在各类代理式任务中提供极高的精度。Llama Nemotron Nano 模型将作为面向 RTX AI PC 和工作站的 NIM 微服务提供,在指令遵循、工具调用、聊天、代码和数学等代理式 AI 任务方面表现出众。
NIM 微服务包含在 PC 上运行 AI 所需的关键组件,并针对 NVIDIA GPU 的部署进行优化,无论 GPU 在 RTX PC 、工作站,还是在云端。
开发者和发烧友将能快速下载这些 NIM 微服务,并可在带有适用于 Linux 的 Windows 子系统 (WSL) 的 Windows 11 PC 上设置和运行。
微软副总裁,Windows 业务负责人 Pavan Davuluri 表示:“AI 正在快速驱动 Windows 11 PC 创新,适用于 Linux 的 Windows 子系统 (WSL) 和 Windows Copilot Runtime 为 Windows 11 上的 AI 开发提供出色的跨平台环境。NVIDIA NIM 微服务为 Windows PC 提供优化,为开发者和发烧友提供可立即集成到其 Windows 应用中的 AI 模型,从而进一步加速 Windows 用户的 AI 功能部署。”
运行在 RTX AI PC 上的 NIM 微服务将兼容先进 AI 开发和智能体框架,包括 AI Toolkit for VSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、LangFlow 和 LM Studio。开发者可以通过行业标准端点,将基于上述框架构建的应用和工作流连接到运行 NIM 微服务的 AI 模型,无论在云端、数据中心、工作站还是 PC 上,都可通过统一的接口使用最新技术
发烧友还可通过即将发布的 NVIDIA ChatRTX 技术 Demo 体验一系列 NIM 微服务。
让代理式 AI 拥有拟人表情
为了向 RTX 发烧友和开发者展示使用 NIM 微服务构建 AI 智能体和助手的方法,NVIDIA 今天首度公开 Project R2X。这是一款具有视觉能力的 PC 虚拟形象,它可以让用户需要的信息触手可及、协助用户使用桌面应用、进行视频会议、阅读和总结文档等。
该虚拟形象采用全新生成式 AI 算法 NVIDIA RTX Neural Faces 渲染而成,这种算法可利用完全生成的像素来增强传统光栅化渲染。然后,面部通过基于扩散原理的全新 NVIDIA Audio2Face™- 3D 模型驱动动画,该模型可改善唇部和舌头动作。R2X 可以通过 CrewAI、Flowise AI 和 LangFlow 等开发者框架连接到 OpenAI 的 GPT 4o 或 xAI 的 Grok 等云端 AI 服务,以及 NIM 微服务和 AI Blueprint,如 PDF 检索器或其他 LLM。注册以关注 Project R2X 的更新。
AI Blueprint 即将登陆 PC NIM 微服务还可通过 AI Blueprint(可在 RTX PC 上本地运行的参考 AI 工作流)供 PC 用户使用。借助这些蓝图,开发者能够基于 PDF 文档创建播客、生成由 3D 场景引导的令人惊艳的图像等。
将 PDF 转换为播客的蓝图可从 PDF 中提取文本、图像和表格,创建可供用户编辑的播客脚本。它还能根据此脚本,使用蓝图中提供的语音或基于用户的语音样本生成完整的音频录音。此外,用户还能与 AI 播客主持人进行实时对话,了解有关特定主题的更多信息。
该蓝图利用像 Mistral-Nemo-12B-Instruct 这样的 NIM 微服务来处理语言,借助 NVIDIA Riva 进行文本转语音和自动语音识别,以及使用 NeMo Retriever 微服务集合进行 PDF 提取。
使用由 3D 引导的生成式 AI Blueprint,艺术家能对图像生成进行更精细的控制。虽然 AI 可以通过简单的文本提示生成令人惊叹的图像,但仅使用文字控制图像的内容极具挑战。有了上述蓝图,创作者可以借助使用 Blender 等 3D 渲染器布置简单的 3D 物体来引导 AI 图像生成。艺术家可手动或使用 AI 生成创建 3D 资产,将其放置在场景中,并设置 3D viewport 相机。由 Flux NIM 微服务提供支持的预打包工作流将可以通过插件 (例如 Blender 中由开发者 ACGGit 开发的 ComfyUI-BlenderAI-node) 使用当前布景生成与 3D 场景相匹配的高质量图像。
NVIDIA NIM 微服务和 AI Blueprint 将从 2 月起开始提供,首发支持的硬件包含 GeForce RTX 50 系列、GeForce RTX 4090 和 4080 以及 NVIDIA RTX 6000 和 5000 GPU ,未来还会陆续提供对其他 GPU 的支持。宏碁、华硕、戴尔、惠普、联想、微星、雷蛇将推出支持 NIM 的 RTX AI PC。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。