IT之家 3 月 10 日消息,Rokid Glasses AR 眼镜于去年 11 月发布,搭载阿里通义 AI,售价 2499 元。
Rokid 今日宣布,在如今 AI 大模型井喷的当下,只搭载一个 AI 大模型显然是不能满足用户对于 AI 的需求,所以 Rokid Glasses 再次进化。
截至目前,除通义千问外,Rokid Glasses 也集成了 DeepSeek、豆包、智谱清言、纳米搜索等多个大模型。Rokid Glasses 将这些大模型分类管理,分为基础模型、视觉模型、搜索模型等。
基础大模型负责整体 AI 能力,如对话,问答和调用产品功能等;视觉大模型负责处理视觉信息,如识别物体等;信息大模型负责搜索当下最新信息对所回答的问题进行信息整合与归纳。IT之家附分类图如下:
每种模型都有自己的专长。Rokid Glasses 会根据不同的场景将用户请求智能分发给不同的模型处理。比如通义的风格是严谨客观,表现为专业的助理秘书的形象,豆包的风格更轻松俏皮,像一个好朋友,用户可以在 App 端选择自己偏好的大模型。
此外,Rokid Glasses 支持用户自定义配置自己的私有模型,可以通过 OpenAI 标准的 API 调用自己的私有大模型,满足更多科研和专业领域的需求。
多个大模型协同工作意味着 Rokid Glasses 的 AI 扩展性高,可根据用户场景和需求灵活配置不同大模型,同时也意味着对其系统的信息分发逻辑和意图分发算法要求更为严格。
在实际使用中,眼镜接收到的信息种类是多样且复杂的,如何保证快速准确地解读信息并给出反馈是研发团队首先要攻克的问题。一般 AI 智能眼镜会把所有获取到的信息全部丢给云端大模型,让大模型自己判断,这种模式下大模型往往需要更多时间识别并做出回应,导致用户体验不佳,响应时间很长。
而 Rokid 在端侧集成自研的意图分类模型,可以在 2 毫秒内完成对意图的分类,再将请求分发给不同的模型。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。