首页 > 智能时代>人工智能

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

新智元 2024/2/9 16:28:58 责编：汪淼

评论：

【新智元导读】深夜，谷歌忽然放出复仇杀器。Bard、Duet AI，如今都成了历史的尘埃。Gemini 既是模型，也是产品，谷歌推向全世界的 AI，在昨夜正式统一。

爆料成真了，谷歌的 Gemini 大杀器果然在昨天晚上炸了出来。谷歌正式官宣，Bard 更名为 Gemini。

从此，谷歌进入 Gemini 时代的新篇章。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

与此同时，迄今为止最强的 Gemini Ultra 所加持的聊天机器人 Gemini Advanced 也在今天正式开放，所有人皆可访问。

从此，所有人都可以在谷歌办公全家桶中用到最强大模型 Gemini 了！

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

当然，这个最强机器人并不是免费的，需要月付 20 美金，前 2 个月可以免费使用。要知道，ChatGPT 每个月的收费就是 20 美元，谷歌此举是直接和 OpenAI 打擂台了。

此次谷歌不仅推出了大模型面向 C 端的 App，还将内部的多个产品接入大模型中。这样，谷歌的大模型就离公众又近了一步。

采取保守策略的谷歌，在去年一年被微软和 OpenAI 的重重险招打得找不着北，但最近的谷歌已经越来越大胆，誓要在产品和生态上攻城略地，扳回一局。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

Gemini，进入谷歌全家桶

以前，或许你会为谷歌千千万万产品的名字感到困惑。但未来谈及谷歌的 AI 时，它们会汇合成同一个名字 —— Gemini。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

Gemini 既是模型名，也是产品名。既是聊天助手，又是聊天机器人，还是搜索引擎。

Bard 聊天机器人、安卓 Gemini 应用程序、Google Workspace 中的所有 Duet AI 功能，通通都整合到了 Gemini 品牌中。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

在谷歌邮箱中，你能让它帮忙总结关于学校最近的邮件。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

在 Gemini App 中，它能帮你根据照片写描述、发帖。

而迄今最强大模型 Gemini Ultra 1.0，更是强到发指。

每月 20 刀！Gemini 开始收费了

属于 Bard 的时代，已经不再了。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

得到「地表最强」的模型 Gemini Ultra 加持后，Gemini Advanced 注定要成为受欢迎的聊天机器人之一。

谷歌博客介绍，借助 Ultra 1.0 模型，Gemini Advanced 在完成复杂任务方面，性能暴涨。比如，对于编程、逻辑推理、遵循复杂指令，以及参与创意项目的协作，胜任力近乎完美。

除此之外，Gemini Advanced 不仅可以开启更长、更详细的对话，还能更好地理解此前提出问题的上下文。

Gemini Advanced 能做的，或许并不比 ChatGPT 差。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

它可以成为你的个人导师，为你量身订制分布教学、样本测验，或者讨论话题。面对更复杂的编码难题时，它能助你一臂之力，提供反馈意见，并帮你评估不同的编程方法。

它甚至可以为那些「数字内容创作者」从构思到实现，通过生成新内容、分析最新趋势，以及寻找增长受众的新方法。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

当然了，正如此前爆料所称，Gemini Advanced 将开启收费模式：

价格为每月 19.99 美元，并提供两个月的免费试用。

这是谷歌全新的 Google One AI 高级订阅计划的一部分。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

计划主要是为用户，提供 Google AI 最好、最顶尖的技术，同时包括 Google One Premium 存储空间优势，比如 2TB 的存储空间。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

此外，AI Premium 用户不久很快就能够在 Gmail、Docs、Slides、Sheets 等产品中使用 Gemini（以前称为 Duet AI）。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

谷歌表示，Gemini Advanced 初代版本已展示出强大的 AI 推理能力，未来还将持续优化。

目前，Gemini Advanced 现已在 150 多个国家和地区提供英语服务，之后会逐步扩展到更多语言。

需要明确的是，Bard 的全新升级可以理解为，是一次纯粹的「品牌」重塑，背后的模型本身并未改变。

早在去年 12 月初，谷歌就宣布了，Bard 背后的大模型从 PaLM 2 迭代为 Gemini。而这次，谷歌给聊天机器人的更名，更是将微软、OpenAI 视为强大的竞争对手。

AI 助手 Gemini 装进手机

此外，在手机端侧用上大模型、聊天机器人 Gemini，也是谷歌布局中的一步大棋。

同在今天，谷歌为 Gemini 和 Gemini Advanced 聊天机器人，分别引入了全新的安卓应用，以及 iOS 上的谷歌应用。

以后，拿起手机只需呼唤一声「Gemini」。不论你身处何处，都可以通过输入、语音、甚至是图片寻求建议。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

比如，出行的半路爆胎，你可以拍一张照片，问问 Gemini 如何处理棘手的难题。又或者，你想举办一个晚餐 party，却不知如何设计，找 Gemini 制作个性化图片，定制流程，准没错！

在谷歌看来：

这标志着我们正构建一个真正的 AI 助手的重要起点 —— 一个既能进行对话、支持多种交互方式又实用的助手。

Gemini 安卓版上线

Gemini 在安卓手机上也能下载了。

除了这种方式，你还可以选择使用 Gemini，替代原来的 Google Assistant，成为手机的默认语音助手。

然后你可以通过长按电源键、在手机上滑动屏幕到角落，或者说「hi Google」，激活 Gemini。这将为我们开启一个全新的手机体验，可以轻松访问 Gemini，并获得与当前屏幕内容相关的帮助。

举个栗子，随手拍一张小清新风格的照片，然后让 Gemini 生成描述。立刻，它生成了多个可用的描述供你选择，「多肉植物和点心」、「桌面静物」、「沙漠气息」.....

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

又或者拍一张狗狗照片，然后可以让 Gemini 为 Baxter 创建一个可爱的社交标题。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

此外，通过 Gemini 应用，你还可以使用许多 Google Assistant 的语音功能，比如设置计时器、拨打电话和控制智能家居设备等等，

iOS 版也来了

在 iOS 设备上，谷歌将在未来几周通过 Google App 提供访问。只需点击 Gemini 切换按钮，即可开启对话。

它可以激发你的创意，创建定制图片，撰写社交媒体帖子，甚至在 Google App 中策划一场约会之夜。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

许多网友已经迫不及待，剁手 20 刀体验最新的 Gemini Advanced。

「还是有些失望的」。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

84 页超长技术报告更新

随着 Gemini Ultra 的正式上线，谷歌也同步更新了 Gemini 1.0 的技术报告。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

论文地址：https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf

在完成大规模预训练后，模型还需要通过后训练（post-training），即在已有的预训练模型基础上进一步训练，来拓展自己的能力（比如在编程和多语言处理领域）并增加更多的功能。

指令跟随

对于 LLM 来说，精准地执行用户的指令是一项基础能力。为此，谷歌采用了一种非常细致的方法来评估模型对每条指令的遵循程度。

具体评价标准有两个：

1. 每条指令的准确率（评估集中遵循的子指令百分比）
2. 完整响应的准确率（评估集中所有子指令都被遵循的指令百分比）

结果如表 14 所示，Gemini Advanced（Ultra）在每条指令的准确率上达到了接近 90% 的平均水平，相比 Gemini 和经过后训练的 PaLM 2 模型有显著的提升。

不过，Gemini Advanced（Ultra）在完全满足所有指令方面还有进一步的提升空间 —— 准确率只有约 54%。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

多模态视觉

通过多模态后训练，Gemini 原生的多模态能力也得到了进一步加强，从而显著提升了模型在各种实用场景中的应用能力。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

其中，得益于监督微调（SFT）带来的指令跟随能力的提升，Gemini Vision 模型的输出风格也更加贴近标准答案，并且成功地在多个测试集上（如 InfographicVQA、AI2D、VQAv2）实现了性能的提升。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

代码

虽然基础模型在编程基准测试中表现得已经非常出色，但后训练数据还是显著提升了代码的质量和正确性。

而这也凸显了高质量示例数据和反馈数据对编程应用的重要性。其中，Gemini 采用的是人工和自动生成的混合数据。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

SxS 得分显示，Gemini（Pro 版本）在使用了更新的后训练策略后，性能显著优于基于 PaLM 2 的旧版 Bard。而 Gemini Advanced（Ultra 版本）在此基础上进一步提升了性能。

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

老牌科技巨头的最后一搏

谷歌如此全力以赴并不奇怪，OpenAI、Anthropic、Perplexity 等强大的对手，都在虎视眈眈，蚕食着这家老牌科技公司的市场。

去年 Gemini 发布的测试中，Gemini 驱动的 Bard 性能很强，几乎和 GPT-4 相当，但速度明显较慢。

现在，谷歌急需证明自己能够跟上行业的步伐。两个难点在于：它既要打造一款引人注目的消费产品，又要试图说服开发者在 Gemini 上构建应用，而非 OpenAI 的模型。

在谷歌的历史上，集全公司之力押注同一件事的情况，只有寥寥数次。比如，曾经的 Google Plus。

但这一次，谷歌似乎在使出洪荒之力，致力于成为一家 AI 公司。万物皆可 Gemini，会是谷歌撕开困境，给 OpenAI 猛力一击的开始吗？

参考资料：

https://blog.google/products/gemini/bard-gemini-advanced-app/

本文来自微信公众号：新智元（ID：AI_era）

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

下载IT之家APP，签到赚金币兑豪礼

关键词：谷歌AI，Gemini，谷歌Bard

谷歌 AI 超大杯 Gemini Ultra 硬刚 GPT-4：包月 19.99 美元，84 页技术报告更新

Gemini，进入谷歌全家桶

每月 20 刀！Gemini 开始收费了

AI 助手 Gemini 装进手机

Gemini 安卓版上线

iOS 版也来了

84 页超长技术报告更新

指令跟随

多模态视觉

代码

老牌科技巨头的最后一搏

相关文章