IT之家 4 月 1 日消息,亚马逊于当地时间周一正式发布了其通用人工智能智能体(AI agent) ——Nova Act。该智能体具备操控网络浏览器并自主执行简单网络任务的能力。与此同时,亚马逊还推出了配套的 Nova Act 软件开发工具包(SDK),旨在帮助开发者利用 Nova Act 构建智能体应用原型。
据IT之家了解,Nova Act 由亚马逊新近在旧金山成立的 AGI(通用人工智能)实验室研发,该技术未来也将为备受期待的生成式 AI 增强版语音助手 Alexa + 提供关键功能支持。不过,亚马逊方面表示,今日起开放的版本为“研究预览版”,功能尚待完善。
开发者可以通过新设立的专属网站 nova.amazon.com 获取 Nova Act 工具包,该网站同时也是亚马逊展示其旗下各类 Nova 基础模型的平台。
Nova Act 的推出标志着亚马逊正式加入 AI 智能体技术的竞争行列,意在凭借自研的通用 AI 智能体技术,与 OpenAI 的 Operator 和 Anthropic 的 Computer Use 等产品展开竞争。当前,多家领先科技公司普遍认为,能够代替用户浏览网页、执行任务的 AI 智能体将极大提升现有 AI 聊天机器人的实用性。尽管亚马逊并非首家开发此类技术的公司,但凭借其庞大的 Alexa 用户基础,Nova Act 未来可能拥有最广泛的应用潜力。
亚马逊介绍称,开发者使用 Nova Act SDK,将能够为用户自动化处理一些基础性网络操作,例如从餐饮品牌 Sweetgreen 订购沙拉或是在线上预订餐厅晚餐。该工具包提供了一系列工具,使 AI 智能体能够浏览网页、填写表单、在日历上选择日期等。
在性能方面,亚马逊声称,在公司内部的多项测试中,Nova Act 的表现优于来自 OpenAI 和 Anthropic 的同类智能体。以衡量 AI 智能体与屏幕文本交互能力的 ScreenSpot Web Text 测试为例,Nova Act 得分高达 94%,超过了 OpenAI 的 CUA(88%)和 Anthropic 的 Claude 3.7 Sonnet(90%)。然而值得注意的是,亚马逊并未公布 Nova Act 在如 WebVoyager 等行业更常用的智能体评估基准上的测试结果。
Nova Act 是亚马逊上述 AGI 实验室对外发布的首个公开产品。该实验室由前 OpenAI 研究员 David Luan 和 Pieter Abbeel 共同领导。这两位专家在去年被亚马逊聘用以主导其 AI 智能体研发工作之前,分别创立了 AI 初创公司 Adept 和 Covariant。
对于一个以 AGI 为目标的实验室为何会开发订购沙拉的 AI 智能体,Luan 在接受 TechCrunch 采访时解释道,他将智能体视为构建超智能 AI 系统的关键一步。他将 AGI 定义为“一个能够帮助你在计算机上完成人类所能做的任何事情的 AI 系统”。Luan 还表示,其团队设计的 Nova Act SDK 旨在可靠地自动化执行简短、简单的任务,并为开发者提供了精确定义何时需要人类介入智能体工作流程的工具。他希望借此帮助开发者创建更可靠的智能体应用,即使这些应用不一定是完全自主运行的。
目前,来自 OpenAI、谷歌和 Anthropic 等公司的早期 AI 智能体普遍面临跨不同领域应用时可靠性不足的重大挑战。根据 TechCrunch 等媒体的测试,这些系统往往运行缓慢,难以长时间独立工作,且容易犯下人类通常不会犯的错误。亚马逊是否已经找到了克服这些难题的有效方法,还是其 Nova Act 智能体也将受困于同样的缺陷,市场将拭目以待。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。