6 月 21 日消息,最近,韩国人工智能公司 Pulse9 推出了一个完全由 AI 打造的韩国流行音乐女团,Eternity。Pulse9 通过该公司研发的“Deep Real”技术打造了 11 位 AI 女团成员,并发布了单曲 MV“I’m Real”。该单曲在 YouTube 上的播放量达到 67 万。
▲图源 Youtube”I’m Real”MV
Deep Real 是指将 AI 设计的人物图像与数据库里的人类面部特征相结合,生成全新的虚拟人物图像。与 Deepfake 不同,它并不会与现实生活中人们的脸部图像进行合成。虚拟人物市场正在兴起,这些虚拟人物市场的背后,正是一代代技术的更迭。
一、首个全员 AI 女团,AI 偶像即将进军影视业
2020 年 12 月,Pulse 9 发起了一个“令人激动人心的 AI(AI heart-throb challenge)”的社交活动。人们在虚拟人物理想型测试中,从 101 位虚拟人物中选出最让人心动的 11 位 AI 成员并组成 AI 女团。像国内的选秀节目《创造 101》一样,Pulse9 打造了一个 AI 世界的“选秀女团”。
Pulse 9 成立于 2017 年,是一家人工智能技术开发公司。最初,Pulse 9 专注于开展 AI 画家的业务,但 AI 画家业务受疫情影响难以展开。此后,他们将 AI 图像生成的业务从绘画、产品定制等扩展到娱乐业务。2021 年 4 月,他们推出了 Eternity 女团,团名 Eternity(永恒)含有“成为与大众永远在一起的最佳虚拟偶像”的意思,每位 AI 角色都有独特的设定。
▲图源 Youtube”I’m Real”MV (小样儿~换了个发型我就不认识你们长一样啦?)
此外,2020 年 12 月,Pulse 9 还与泰国 Good Drama 公司签约了《AI 偶像进军泰国及进军电视剧产业的谅解备忘录》,希望打开 AI 偶像的泰国市场和 AI 偶像影视业业务。
泰国 Good Drama 公司计划投资 7.4 亿韩元(约为 420 万人民币)制作一部名为“我亲爱的 AI(My Dear A.I)”的电视剧。这部电视剧主要讲述男主角 AI 偶像与人类女性之间的爱情故事,Pulse 9 负责制作 AI 男偶像。
“在韩国,虚拟偶像与人类交谈和互动的时代正在开启”,Pulse 9 的 CEO Park Ji-eun 表示,而她作为创造者,将会赋予 AI 偶像更具幻想和更具创造性的特点。
同时她还表示,与真人偶像不同,AI 偶像可以自由表达自己的观点。因为人们对 AI 偶像更具包容性,而 AI 偶像对人们的恶意评论和批评承受度也更强。
值得一提的是,Pulse 9 制作的所有 AI 偶像都是虚拟人物,在现实世界中难以找到相同的样貌,在一定程度上避开了肖像权纠纷。
二、与“Deepfake”不同,Deep Real 打造的“脸”查无此人
Pulse 9 通过该公司自主研发的 Deep Real 技术打造了 11 位 AI 女团成员。
Deep Real 技术可以通过人工智能创建虚拟人、物体、室内空间、生物以及虚拟自然环境等。现有的虚拟偶像多数是动画师长时间人工设计,逐帧创建图像,打造 AI 视频。但 Deep Real 技术摆脱了现有虚拟角色创作的面部设计和动作等限制作时间长,运营成本高等困境,使用 AI 模型来生成虚拟人物。Pulse 9 公司报道,他们通过 Deep Real 技术可调整虚拟偶像的眼神、面部表情、嘴角等各处细节,使其与真人的外貌、表情都达到高度相似。
Pulse 9 先通过 AI 技术创建了新的虚拟人物图像,然后他们通过 AI 模型将虚拟人物图像与数据库里的参考人物图像的面部特征进行合成,得到了一个全新的虚拟人物图像。由 AI 设计的虚拟人物图像与真实世界的人不会重合。
Pulse 9 强调,Deep Real 不同于现有的 Deepfake,因为它以合理的成本创造了逼真的虚拟人物,而不是通过合成真人脸部。他们认为,Deep Real 技术的操作过程会更加复杂。
Deepfake 是指一类深度造假的换脸技术,将 A 的脸换到 B 身上。通过人脸互换,它可以让 A 做出来自己从没有做过的动作,说过一些没说过的话,造成以假乱真的效果。
Deepfake 以深度学习技术为基础。通过上传被替换的“原图”和合成后的“假图”到生成对抗性网络(GAN)模型中,当图像的逼真度足够高时,该图像就会被输出。然后,AI 模型再通过提取视频关键帧,人脸对齐等技术,让人脸完美“融合”到原视频。这类视频仿真度高、欺骗性强,肉眼一般难以识别真伪。
▲图源 Github
2017 年底,一位名为“Deepfake”的 Reddit 用户,将神奇女侠女主角的脸成功替换到其他电影上,这个“逼真”的视频轰动一时。
随后,有关人士将 Deepfake 的开源代码发布在 Github 上,其较低的技术门槛让非专业人士也能快速掌握 Deepfake。
2019 年 8 月 31 日,国内软件 ZAO 凭借着“仅需一张照片,出演天下好戏”口号迅速在网络走红,短短三天后占据了苹果应用商店免费排行榜的第一名。但由于其用户条款违法、非法收集用户生物信息、侵权等问题,ZAO 于 9 月 3 日迅速下架。
Deepfake 的出现,尽管会在声音合成、视影音领域的修复上有所帮助,但具有较大的安全隐患。一段子虚乌有的视频不但会让有关人士名誉权受损,而且还会引起市场动荡,甚至威胁国家安全。
2019 年 11 月,我国发布了《网络音视频信息服务管理规定》,该规定明确指出:网络音视频信息服务提供者应当部署违法违规音视频以及非真实音视频鉴别的相关技术方案。
同时,全球各地也都开始了抵制 Deepfake 的“战斗”。
2019 年 9 月,Facebook 宣布了全球 Deepfake 检测挑战赛,旨在号召研究人员寻找“打假”的有效方法,提升鉴别假视频的技术,维护和谐的网络环境。
随后,Google AI 开源 Deepfake 视频检测数据集,希望能帮助研究者找到更好的鉴别假视频的方法。
美国加州随后也颁布相关条令,禁止发布、传播 Deepfake 类视频;禁止在大选期间,使用竞选者图像制造 Deepfake 类的假视频。
尽管各方动作不断,但事实上,由 Deepfake 制造的假视频仍在各平台屡禁不止,给人们带来困扰。
与 Deepfake 的战斗,还一直在继续。
三、虚拟人物迭代 3.0,市场总额高达 2000 亿元
据爱奇艺发布了《2019 虚拟偶像观察报告》显示,中国二次元用户规模达到 4.9 亿,有 3.9 亿人走在关注虚拟偶像的路上,2020 年中国虚拟偶像市场总产量达到 2000 亿元。
最早的虚拟人物通过歌唱软件与机器人系统叠加形成能“唱歌的机器人”,从而衍生出电子音乐、鬼畜文化等多元文化。
随后,2.0 虚拟偶像文化全面爆发,洛天依、初音未来等通过合成软件声源和拟人化形象的虚拟偶像在二次元形成“现象级”出圈,开始以虚拟偶像的身份参与各类商业活动。虚拟人物行业初具规模。
▲来源于 B 站 2020 初音未来:未来有你线上 AR 演唱会
目前,虚拟偶像迎来 3.0 时代,通过人物 3D 建模、AI 合成技术,虚拟偶像们脱离之前的动漫人物、软萌的卡通类的外表,逐渐像一个真正的“人”,Eternity 正是如此。
此外,虚拟人物在其他领域也具有各展身手。
今年两会期间,央视网的数字虚拟小编小 C 在两会节目中作为记者,与梁倩娟、马慧娟等全国人大代表进行独家对话。
▲图为虚拟小编“小 C”,来源百度 AI
虚拟小编的背后是百度智能云为其提供技术支持,百度智能云将数字人技术与云计算技术相结合,支持“小 C”在 AI 驱动和人工监管双重模式,希望给数字人赋予“人类温度”。同时,百度利用其强大的数据库作为支撑,第一次使用了 4D 扫描技术来进行高精度面部数据采集,并运用 AI 技术定进行了反复的迭代调优,让“小 C”能够更加活灵活现地与人交流。
三星在 2020 年也推出了虚拟人项目。该团队通过 Core R3 技术,创造了 Neon。项目负责人普脉・米斯特里(Pranav Mistry)发推文说,Core R3 技术“现在可以自主创建新的表情,新的动作,新的对话,与原始数据完全不同。”
而其中最具特色的虚拟人物,莫过于 6 月 1 日在智源大会出现的中国首位原创虚拟学生“华智冰”。
“华智冰”是智源“悟道 2.0”模型、小冰 AI 完全框架、智谱 AI 数据与知识双驱动的 AI 框架三方联手打造的虚拟人物。“她”拜清华⼤学教授唐杰为师,进入清华实验室学习。具有思考和回答复杂问题的能力,能将新知识融合到自己的模型中去,从而不断地提升自己的学习能力,建立自己的知识库。
与多数主打外貌的虚拟偶像不同,“华智冰”作为虚拟学生,更重视虚拟人物的“内在”,注重 AI 的学习能力和可成长性。(内在美更重要!)
▲图为“华智冰”,中国首位虚拟学生,来自 B 站“清华大学”账号
尽管人们对虚拟数字人技术一直抱有较高的期待,但目前的虚拟数字人仍有一定的不足之处。
目前,虚拟人物产业投入成本高,收入低,并且在技术、内容互动等问题上都不够成熟。大多数公司对虚拟人物投入,都难以盈利。
虚拟人物的时代还尚未完全到来。
结语:通过虚拟人物看“元宇宙”,虚拟和现实如何“和谐”相融
虚拟偶像、虚拟主播、虚拟数字人随着科技的进步逐一呈现在我们面前。如今,虚拟世界已经拥有了虚拟人物的“入驻”。“元宇宙”世界似乎通过这些虚拟人物构建了一个基本框架,向我们展开了一个全新的世界。
随着 AI 和 VR 技术的不断提升,真与假之间界限已经逐渐模糊。许多软件都非常希望收集各类人体生物数据,但却难以保证用户隐私安全。Deepfake 的出现正是一个“警钟”—— 无论是怎样的世界,秩序安全都是必不可少的。
如果像 Deepfake 这般的深度伪造技术,人们都难以寻找到有效的方法解决。那么,虚拟世界与现实世界的快速相融则会带来更多的困境,让人们逐渐失去对现实世界的信任感,从而进一步加剧社会孤独。
如何在现有体系里平衡虚拟人物和真实人物的关系,把握好现实和虚拟的界限,我们还有待探寻。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。