本文来自微信公众号:触乐 (ID:chuappgame),作者:祝思齐
人们仍在尝试找到正确的位置。
最近几年,AI 引发了大量话题与争论。去年 9 月,触乐发表了第一篇讨论 AI 绘画的文章。自那时以来,AI 技术又取得了更大的发展。不仅仅是绘图,在文字、配音乃至配乐方面,AI 都能够参与。开源软件的迭代和许多功能强大的插件的出现,也进一步提高了 AI 工具的易用性。
同时,争议的声音和围绕 AI 产生的焦虑从未远离。前不久曾传出雷亚游戏解雇画师,用 AI 绘图完全替代的消息。雷亚很快发声明否认,而玩家仍然因为游戏卡面质量下降等原因提出质疑。另一方面,有原画行业的资深从业者发布了一份问卷调查的结果,其中总结了多个厂商在招聘时对求职者 AI 技能方面的要求,还调查了不同水平的画师在使用 AI 后效率提升的程度。这一问卷主要是为了说明美术从业者现阶段依然具有相当大的不可替代性,缓解一部分不断蔓延的恐慌。
这种混乱的状况是必然的。当 AI 的出现和经济下行乃至整个行业的紧缩叠加在一起,人们很难分辨 AI 因素究竟在失业浪潮中占有多大比重,而这项技术又是否和传言的那样无所不能。因此,触乐再次联系了游戏公司中的制作人、视觉负责人,乃至从游戏行业跳槽到 AI 团队的成员,试图了解目前业内对 AI 的应用究竟到了哪个阶段。
我们最终发现,即使 AI 的功能看上去已经如此强大,不同厂商和开发者对它的应用依然存在很大差别,并没有全都融入工作流程 —— 这取决于厂商的规模、游戏产品的类型,乃至开发者自己对 AI 技术乃至游戏开发本身的理解。
AI 应用的现状
“怎么把 AI 融入工作流程?”一位游戏开发者的回答出乎意料:“好问题,我们也想知道,所以正准备开会讨论。”
某种意义上说,这是相当一部分游戏厂商的现状。AI 的浪潮的确已经涌来,但很多人依然在水边试探。
吉川明静目前是一家 AI 团队的成员,主要为企业提供 AI 绘图的服务,以及进行软件技术上的培训。这个团队成立于 2023 年初,十分看好迅猛发展的 AI 技术的前景。目前,团队中的人都有不同的从业背景,吉川明静是游戏制作人出身,因而比较多地接触到游戏厂商。
在这个过程中,他发现不同厂商内部对 AI 的普及程度不太一样。像腾讯、网易这样的大厂和独立开发者在对 AI 技术的应用上非常积极。他们处在光谱两极,出于完全不同的理由想要尽快把类似的技术投入使用。处在中间的厂商,有相当一部分仍然在摸索期,寻找真正能够提升效率的办法。换句话说,就是还没能把 AI 技术完全融入工作流。
大厂的例子可以从它们在网上发布的官方案例分享中获取到。从今年春天开始,网络上开始零星出现头部厂商分享的教学文件。其中包括相当详尽的 StableDiffusion 入门手册,以及部分实际应用案例。
在网易公布的 AIGC 工作流程总结中,可以看到目前厂商已经尝试把 AI 技术应用到 CG 业务、赛事业务、虚拟角色等众多领域。这套流程主要由人来进行最初的需求分析和最后的润色,中间的寻找参考、通过草稿生成设计方案,乃至局部细化的阶段都可以让 AI 参与。
从总结中的案例来看,图像方面,AI 绘图最常被用在图标、直播特效等通常不会被用户仔细审视,精度要求也并不特别高的领域,比如游戏中重复的宝箱图标、勋章图标等等。其次是在场景设计、服装设计等应用的前期快速产出多种方案,在初步细化之后给需求方挑选。最后是一些杂项,比如生成写实风格的虚拟人脸、简化的 Q 版形象,乃至统一电竞选手的定妆照风格。
在绘图之外,ChatGPT 目前被用来生成用户问卷大纲,以及对现有的数据文本进行数据分析。
游戏制作人史官则提供了中型厂商分工种的应用案例。
因为图生图技术的进步,以及允许绑定骨骼调整画面的插件 ControlNet 的出现,原画出草稿给 AI 细化的流程越来越方便。从 AI 大量的细化结果中挑选有用的进行人工细化,可以把原来 10 天的工作量缩短到三四天完成。“其实是把人工从抠细节的大头里解放出来,重复性的工作和开放性的工作都交给 AI。”史官介绍。
程序方面,史官公司的程序员现在基本养成了“有事问 GPT”的习惯,把它当做一个高级搜索引擎,哪种算法和做法不清楚就问 GPT。这一举措对效率的提升,随着 GPT3.5 进化到 GPT4 实现了飞跃。哪怕 GPT 给出的代码有 Bug,还可以丢回去让它自己修,相当于给程序员配了一个任劳任怨的助手,而且几乎没有额外成本。
策划在剧情中也可能用到 GPT,比如给 GPT 的线程设定一个 NPC 的性格,然后把想要这个 NPC 说的台词丢给 GPT,让它用指定性格说出来。这样可以避免文案策划在写对话时无法体现出足够的人物性格差异的情况。
一家厂商的视觉负责人鹏哥介绍说,除了绘画,AIGC 在视频领域的表现也不错。AI 配音和配乐已经完全可以用于视频广告素材。
至于更小型的独立团队乃至个人开发者,他们对 AI 的应用有可能更加激进。一方面,这些团队可能原本就人员不足,缩减成本也是刚需,是否能用 AI,有时候甚至决定了他们可否启用一项功能。有独立开发者告诉触乐,他们曾经用不起原画,有了 AI 之后能让一些图片呈现出类似大公司的效果。ChatGPT 的进化则让一些没有编程经验的个人有机会开始尝试开发游戏。
另外,独立开发者有可能根据个人兴趣去尝试实验性的作品,不在意试错。现在 Steam 上零星可见图片、剧本、配音等全部由 AI 生成的游戏。它们可能玩程度并不高,甚至不能算正式的作品,但也是应用这类技术的一种方向。
依然存在的阻碍
许多例子都说明 AI 可用,但和网络上一些比较夸张的言论和效果相比,要真的提升实际工作的产出,还取决于许多其他变量。比如传说中的“降本增效”,实际情况就和想象的不太一样。
根据鹏哥的反馈,在“增效”方面,比如角色、场景图的绘制,在有 AI 的情况下平均提效能达到 50% 以上,的确有显著效果。不过,在“降本”方面,公司对成本的节省主要省在外包上,内部的成本其实是明显增高的,因为需要投入更多人力负责 AI 使用和探索方面的工作。“AI 现在生成的东西和你描述、想象的还是会有出入,尤其是细节上不可能像人直接设计的那么好,所以试错、反复修改的时间会更多一些。”
史官也觉得,ChatGPT 等给出的反馈在准确性上还有提升的空间。“现在还不能给出特别完整和系统性的反馈。如果能手把手地给出能实现某个功能的准确代码,个人开发者的开发难度会进一步下降。”
“AI 的确上手很容易,所以一开始会给你一种很好用的错觉,很上头。”鹏哥描述他在工作中使用 AI 的感受,“但想深入及精准地应用到工作中,还是有较高的门槛。不仅要求美术专业能力,还要有很好的逻辑思维能力。”
这主要指的是,操作者要知道让 AI 去生成什么,一开始的创意和想法才是最重要的。“说白了,AI 能帮你把 1 到 100 做得很好,但从 0 到 1 还是得看人。”
把 AI 完整地融入工作流也是需要摸索的。“打个比方,一张原画如果是画师从零开始画起,会有草稿、线稿、色稿多个阶段,中间会有很多图层。有的公司对这一点是有明文规定的,方便在你前后接手稿件的人顺利上手。要修改的话,可以很明确地回到某个中间阶段去修改。”吉川明静说,“再加上很多角色有做 Live2D 的需求,需要对画稿进行切分。可是,AI 是直接一张单图层扔给你,在这个基础上去改其实是非常麻烦的。”
因为涉及到修改,AI 对不同水平的画师效率提升的程度并不相同。在本文开头提到的调查中,下游和上游的画师倾向于认为,AI 对效率的提升不显著。因为下游画师即使看出 AI 绘图的问题,因为修改能力不足,效率提升依然不大。上游画师则认为问题太多,修改效果太差,不如重画。认为效率提升显著的以中间层画师居多。
而从团队整体的角度看,除了产出本身的效率,提升沟通效率其实也很重要。“因为以往的话,可能大家头脑风暴完,有了一个概念,再把这个概念落实到视觉上要花几周的时间。现在就很快,可能几个小时你就能拿出一个很接近成品的东西给需求方或者老板去挑选。”吉川明静说,“很多人会忽略这样的沟通成本,其实平时,这样的沟通占据了大家非常多的时间。”
而鹏哥认为,不知道如何融入流程的本质原因,是 AI 让游戏厂商的生产方式出现了革新。就像最初 PS 和数字绘画出现的时候一样,人们应该从根本上考虑更换创作方式。
“比如说原来我们去找外包画图,外包公司里有个组,主笔负责设计草图,助手负责上色,擅长画脸的画师专门画脸,再有专门的人拆件、补全细节,或是绑骨生成 Live2D 之类的…… 就是这么一套流水线的分工。”鹏哥说,“现在有了 AI 之后,AI‘啪’地直接给你出个图,这套流程可能就倒过来,由人负责抠图,分层,补全修改细节……”比起一些水准参差的外包机构,AI 出图的质量可能更加稳定。
虽然看起来都是体力活,目前后者耗费的时间比前者更短。“本来人工找方向、人工细化的话,哪怕一开始就分了层,总共大约需要 10 天。现在 AI 找方向 1 天、AI 细化 1 天、人工用 AI 半成品分层 2 天、人工后期细化 2 天,总共 6 天,比起原来还是缩短了。”史官计算了一下整体的效率,“而且 AI 负责干活的两天,人在干别的事,或者干脆就下班了,丢给显卡晚上算,互相不影响。”
当然,AI 也不是万能的。几位受访者都提到一个典型的例子:目前以独特美术风格为卖点的产品,AI 还是帮不上太大的忙。
原因之一是谨慎。具有一定规模的厂商很少会在商业游戏中直接使用 AI 生成的内容,也不会面向玩家和用户宣传这一点。“还是有一部分人很反感这个,可能比例不高,绝对数量却不算少。”吉川明静说,“尤其是在二次元游戏当中,很容易被玩家‘炎上’。”毕竟这类游戏的价值往往就在于美术资源,不管是真人画师“翻车”,还是真的使用了 AI,都会面临质疑。
另一个原因在于可操作性。去年就已经有开发者提出,想在本地训练适配自身风格的 AI。据吉川明静介绍,这个问题,还有曾被零星提及的 AI 工具和其他办公软件的兼容性问题,在技术上几乎都得到了解决。如今不仅 Photoshop 等常用工具已经推出了内置 AI 插件、ChatGPT 接入了搜索引擎,StableDiffusion 这样的开源软件已经能允许厂商根据自己的需求对功能进行拆分和特化。理论上讲,现在每个厂商都能拥有一套为自己的项目量身定制的 AI 工具套组,能够在本地针对自己的产品风格进行训练。
但这种工具套组也不是人人都能用。鹏哥从中型厂商的视角出发,解释了 AI 工具所需要的隐形资源。
“比如 StableDiffision 未来的发展方向,应该主要就是靠具备再开发能力的 B 端公司做定制化的优化调整,培养更有独特性的模型。可是吧,这个东西需要依托两个基础:一个是算力,而算力意味着钱;另一个是数据,你要有大量的本地数据可以喂给 AI。”
大公司的数据量一定多于中小公司。“就好比广告业,大型的广告公司(如 4A 广告)每年在全球做上百个同类型项目,小型广告公司(如创意热店)一年只有几个案例。虽然这一两个可能做得特别好,都是精品,这个数据量却很难支撑对 AI 的定向训练。”鹏哥说。缺少定向训练,AI 绘图就会非常同质化。“说白了,就是容易训练出网上流传的那种最普通最标准的二次元画风,没有什么竞争力。”
所以在鹏哥看来,迅猛发展的 AI 技术的确把生产力“下放”了,让用不起原画的小团队能拥有像模像样的美术,让不会编程的独立开发者从 ChatGPT 里复制出可用的代码,可是重要的是,大厂仍然拥有引领性的优势。“未来要发展 AIGC,之前的时代积累下来的基础数据可能就是财富。”
寻找正确的位置
从这些开发者的反馈来看,AI 在开发过程中已经可以发挥相当的效果,但目前还没有一些人想象中或者吹嘘的那么万能与强力。
史官觉得,如果团队中使用 AI 的效果不好,可能是管理者没有想好到底让 AI 干什么。这终究是一个观念问题。
“有些人希望 AI 实现从无到有的成品输出,这目前显然还做不到。当他们发现 AI 不能直接给出最满意的结果,没有完全替代掉某个人工职能,就觉得 AI 没用。”史官说,“这种一步登天的想法是不对的。AI 是给开发者用的加速工具,不认清这点用不好 AI。”换句话说,AI 甚至不能算作一个隐形或智能的员工,而是现有员工的助手,是用来给合适的人提升自身效率的。
鹏哥的想法则是,在像 StableDiffusion 这样允许厂商定制的开源工具普及之后,未来的 AI 软件应该会像类似飞书、钉钉的办公软件一样,由大厂或专业的团队进行配置,由中小厂商去购买使用。吉川明静所在的团队,已经开始考虑在长期合作的项目中提供类似的服务。
我们的确站在一个新时代的边缘,但还远远没有真正踏入其中。把技术用在哪里、用法激进与否、是否被受众接纳,这些还有很大一部分仍在等待探索和验证。
归根结底,当“使用 AI”这件事逐渐成为常态,行业中的人都在尝试找到正确的位置 —— 这既包括 AI 作为开发工具的位置,也包括自己作为使用者的位置。这将会是一段漫长的摸索期。至于在这段时期最后等待着开发者的是机遇还是更严酷的挑战,可能仍然需要时间来证明。
(应受访者要求,文中部分人物为化名。)
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。