一款新的聊天 AI 被网友们玩疯了。
能直接生成代码、会自动修复 bug、在线问诊、模仿莎士比亚风格写作…… 各种话题都能 hold 住,它就是 OpenAI 刚刚推出的 ——ChatGPT。
有脑洞大开的网友甚至用它来设计游戏:先用 ChatGPT 生成游戏设定,再用 Midjourney 出图,简直是 AI 生产力一条龙了。
有人还将 ChatGPT 的回复与谷歌搜索结果对比,惊讶地发现 ChatGPT 在实用性上强太多:谷歌这是要凉啊。
甚至有人预言如果谷歌不做出改变很快就会被淘汰,到时候自己愿意每月花 15-20 美元使用 ChatGPT。
不过好消息是,目前 ChatGPT 正处于免费试用阶段,有条件的小伙伴可以赶紧试试。
ChatGPT 有多神奇?
有网友分别问谷歌和 ChatGPT“如何使用 Latex 表示微分结果”,相较于谷歌中规中矩的回答:
ChatGPT 则是一下给出了直接可用的代码,你只需动动手复制粘贴即可:
还有人让 ChatGPT 给出冒泡排序的最坏时间复杂度,并且要求它用“19 世纪 40 年代黑帮电影中讲话很快的聪明人”口吻说出来,也被 ChatGPT 轻松拿捏:
直接问下面代码的 bug 是啥,ChatGPT 也能给你说得明明白白:
除了计算机,ChatGPT 在其他领域表现也很出色,比如它还能 AI 在线问诊。
当你告诉它自己得了皮疹,并且呼吸困难,感觉很虚弱时,ChatGPT 会像医生一样为你分析病因,并建议你比起吃药,更需要戒烟、多锻炼。
与搜索引擎里需要小心分辨的医疗广告对比,可以说很贴心了。
还有许多机智的网友,像上文提到的那样,用 ChatGPT 来搞设计。
比如这位网友让 ChatGPT 给自己设计卧室,然后用它给出的文字做提示词,去 MidJourney 生成图像,连请设计公司的钱都省了。
那么,介绍了这么多,ChatGPT 背后原理究竟是什么?
背后原理
顾名思义,ChatGPT 是在 GPT-3.5 系列中的一个模型上进行微调而成,该系列已在 2022 年初完成了训练。
它以对话方式进行交互,既能够做到回答问题,也能承认错误、质疑不正确的前提以及拒绝不恰当的请求。
与 OpenAI 今年初发布的 InstructGPT 一样,ChatGPT 也是使用强化学习进行训练,但在数据收集设置上有所区别。
在模型训练中,OpenAI 使用监督微调:训练者提供对话样本,扮演对话的双方,即用户和 AI 助手。
除此之外,训练者还可以访问模型编写的建议,帮助他们撰写答案。
为了创建强化学习的奖励模型,研究团队需要收集比较数据,为此,他们随机选择模型编写的信息,对替代结果进行抽样,再让训练者对样本进行排名。
通过上述的奖励模型和近端策略优化对模型进行微调,并执行了此过程的多次迭代,最后得出了该模型。
不过别看它在许多方面表现都很出色,研究人员也承认现阶段 ChatGPT 还存在一些 bug。
举个例子,有网友在多次尝试后就指出,ChatGPT 经常会过度使用某些短语,比如反复重申“自己是由 OpenAI 训练的语言模型”。
除此之外,有时候 ChatGPT 的回答过于冗长,甚至当网友告诉它自己需要更短一点的回答时,它反而说的更多了。
还有理性的网友指出,ChatGPT 想要替代谷歌也没那么容易。
一位在 Alphabet 工作的网友就现身说法,谷歌也不是没有考虑过在搜索引擎中引用大模型,但最大的问题是成本太高了。
如果要对用户收费的话,价格很可能高达 150~200 美元每月,恐怕没有几个人愿意支付这笔钱。
不过,OpenAI 的 CEO 萨姆・阿尔特曼(Sam Altman)对 ChatGPT 的未来发展表示很有信心:
他表示,语言接口将是未来的一个发展方向,而 ChatGPT 就是为大家先打了个样,相信很快大家就能用上能跟自己聊天、回答问题并提供建议的 AI 助手了。
话说回来,你还想到了 ChatGPT 哪些好玩的用途?
有条件的小伙伴赶紧戳下面链接试试吧~
指路链接:
https://chat.openai.com/
参考链接:
[1]https://twitter.com/sama/status/1598038818472759297
[2]https://news.ycombinator.com/item?id=33817682
[3]https://twitter.com/jdjkelly/status/1598021488795586561
本文来自微信公众号:量子位 (ID:QbitAI),作者:羿阁
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。