输入一句话,AI 就能为有志于从事艺术创作的任何人,生成一幅创意画作,不管创作者此前是否接受过专业的艺术训练。
近两年,海外用户借助 Disco Diffusion、MidJourney 等 AI 绘画软件来进行艺术创作,逐渐成为一种风潮。在国内,也有了诸如百度文心一格、TIAMAT 等这类适用于中文描述语输入、更能理解中国文化审美的 AI 艺术和创意辅助平台诞生。
对专业者而言,这类 AI 绘画辅助工具是一个很好的创意助手。而一些素人则利用这些工具,发展出了自己的斜杆事业,在抖音上做壁纸号,在闲鱼上卖描述语,有的还将自己的作品卖给了包装厂或数字藏品业者,赚到些许零花钱。
01、AI 式创作自由
吴先生本职工作是一位医生,他爱玩抖音,闲暇之时常想着在抖音上做点什么来挣钱。
2 个月前,他看到不少创作者在抖音上做壁纸号,也就是创作者会发布一些好看的照片或图片,用户可以下载拿去当电脑或手机桌面。下载时用户需要看一段平台广告,创作者则能从广告播放中获得平台分成。
据吴先生的观察,壁纸号圈仍属小众,但圈中也有 2、30 万粉丝的创作者,通过向用户输送风景、人物、汽车等这类美照,月入上万。
吴先生本身是风景照爱好者,也想做一个风景类的壁纸号,但苦于没有多少素材。正发愁时,他接触到了 AI 绘画,发现只需要在 AI 绘画软件里输入相关描述语,就能生成好看的图片,这解决了他素材缺乏的难题。
吴先生下载了两款海外的 AI 绘画产品,一款是 Disco Diffusion,一款是 MidJourney,在抖音上注册了一个账号,名为“AI 美图”,便开始作画。
DiscoDiffusion 每天有 3 小时可免费使用,MidJourney 吴先生则充了会员费,每月 30 美元。每张图平均几分钟就能生成的创作效率,足以支撑起吴先生做账号的素材需要。
在吴先生看来,这两款软件擅长的重点各有不同。Disco Diffusion 擅长画场景,MidJourney 擅长画人物或动物之类的近景。
在有了这两款软件的加持后,身为医生的吴先生实现了创作自由。
他通过输入各种描述语,来不断试错,一天能够发布 7 到 8 张作品。虽然后来吴先生发现,因为用户圈子太小,并不需要每日在抖音上传这么多。
更难能可贵的是,虽然没有艺术积淀,但并不妨碍吴先生创作出可卖出价格的作品。
据介绍,吴先生创作的一幅赛博朋克机器人,其背后的描述语,被一位从事数字藏品交易的人士以数十元价格买去,这让吴先生惊讶不已。
尔后,这位人士又请吴先生创作了一组十二生肖图片,用作数字藏品开发。吴先生用 AI 为每组生肖创作了 3 张图片备选,最后这一组图片背后的描述语,以数百元的价格售出。
这给了吴先生以启发。由于吴先生的抖音号粉丝才 200 多人,难以通过广告分成的方式挣到钱,他索性决定专门去卖描述语。
百条描述语标价 20 元,拿到抖音、闲鱼上去卖,有印刷商前来购买,这形成了吴先生的零花钱收入。
与吴先生经历类似的还有小红书博主土味牛仔,摄影专业出身的他,今年 6 月起开始尝试用 MidJourney 来进行 AI 绘画。
土味牛仔的 AI 绘画作品多以牛仔为主题,风格涵盖东方元素、未来感、科幻感等,点赞量高的达数千,他习惯把摄影时无法实现的脑洞告诉 AI,让 AI 帮他实现。
4 个月的时间里,土味牛仔一共在小红书发布了 117 张 AI 绘画作品,其中每张作品背后平均的生成次数为 50 次,可谓精益求精。
创作者在学习,AI 也在学习。目前,MidJourney 里共记录了土味牛仔的 10000 多次生成记录。现在土味牛仔只要一输入相关词汇,AI 就能生成相关额外的联想。有时土味牛仔会怀念“不太听人话”、更具备天马行空创意的 AI,而不是对人类思维偏好越来越贴近的圆滑 AI。
在小红书上发布 AI 绘画作品以后,土味牛仔说他接到过几次约稿,也有人找上门想直接购买原图留作 NFT 收藏,但这样的人屈指可数。目前他在 AI 绘画作品上的收入还不足以支付他在 MidJourney 上的投入。
据土味牛仔在圈子里的观察,大家使用 AI 绘画的原因各不相同。有插画师朋友会用 AI 生成作品的草稿,以此为基础进行创意和修改。做建筑设计的朋友则会利用 AI 来进行头脑风暴。但更多素人就是图一个新鲜,就是想要看“超人跟钢铁侠合在一起是什么样子”。
在用户们的推动下,B站、抖音上等介绍 AI 绘画软件和教程的视频越来越多,小红书则成了 AI 绘画作品的一个重要展示平台,闲鱼则扮演了一个销售描述语的平台角色。
02、AI 绘画技术的迭代
AI 绘画的源头可以追溯到上世纪 70 年代。
计算机问世后的 10 年,就有艺术家打造电脑程序 AARON 来进行绘画创作,其主要原理是控制机械臂来作画,但当时的技术成本比较高,且只能得到抽象的结果。
而现代意义的 AI 绘画,主要是指 AI 从海量图文对应的数据中学习“语言描述”与“艺术画面”的关联,以随机化的起点开始,不断修正画作,最终形成在审美上与人类经验与知识高度一致的成品。
据百度文心一格相关负责人介绍,现代意义 AI 绘画技术的雏形,主要出现在上一个十年中。
彼时的技术可以批量完成由文本信息指定的画面生成,技术上包括风格迁移、元素拼接和对抗生成网络(GAN—Generative Adverserial Network)等。
从生成的画面质量来看,虽然这些技术使 AI 绘画的水平有了明显进展,并且在比较强烈的风格上有了初步的应用可能性,但与人类作画质量依然存在差距。
AI 绘画最近的一次技术爆发是 2022 年对扩散生成模型的引入,这类模型用于文生图后,能够在更短的时间内,像素级建模并生成分辨率显著提升的绘画,并且在美感、细节精细度有非常显著的提升,一些 AI 绘画的成品已经和人类作画的质量不相上下。
行业里普遍认为,从 2021 年到 2022 年,是 AI 文生图技术发展最快的两年,诸多新的学习模型或产品诞生,AI 绘画的风潮也开始发展。
一是 Open AI 于 2021 年初发布的深度学习模型 CLIP(Contrastive Language-ImagePre-Training)。
Open AI 是一家于 2015 年 12 月成立于美国的人工智能研究公司,它用 CLIP 先后创建了 DALL-E 和 DALL・E 2 两个 AI 系统,为用户构建了可以根据文字描述创建更逼真、更准确图像的能力。
二是于今年 2 月初开始出现并流行的开源绘画程序 Disco Diffusion,它是一个由谷歌推出的 AI,开发者是艺术家兼程序开发员的 Somnai_dreams 。
Disco Diffusion 的特点是能够高效合成视觉数据,图片生成的质量直接击败了 GAN 模型。但缺陷仍然存在,主要表现在 AI 绘画欠缺细节,渲染的时间过长,内存资源消耗巨大。今年 7 月开始测试的 Stable Diffusion 程序,则很快改进了以上缺点。
三是今年 6 月推出的 MidJourney,它是一个富有创造性的 AI,用它生成的图片质量得到了大幅度的提升,且以月费为方式的商业化做得比较成功。目前公开资料显示 MidJourney 的用户成员已经超过了 240 万人。
在国内,AI 绘画也开始逐渐有了热度。
像 Stable Diffusion、MidJourney 这类模型,主要是针对英文世界的用户,语言和文化的差异形成了国内用户使用海外 AI 绘画软件的阻碍。国内用户呼唤中文世界的文生图产品,这形成了一定的市场需求。
TIAMAT 成立于 2021 年、被称为是国内首批 AI 生成式平台。今年上半年,TIAMAT 开始在小红书、抖音等社交媒体上发布中文文生图的产品,赶上了 AI 绘画的第一波热潮。
TIAMAT 致力于为个人用户和企业客户提供创意生产、广告、数字藏品等场景形式下的服务。日前,TIAMAT 已宣布完成数百万美元天使轮融资,投资方为 DCM。
今年 8 月,百度发布了 AI 艺术和创意辅助平台文心一格,它使用了百度自主研发的产业级知识增强大模型 — 文心大模型,通过语义理解 + 多画作风格适配 + 结果优化排序,让用户只需要输入一句话,就能完成画作,包括意向、具象等多种类型和风格。
文心一格被认为有效地解决了中文世界中,需求描述困难、多样化需求强、模型生成结果筛选难的困难,降低了中文世界用户使用 AI 绘画的难度。
基于文心一格平台,由百度数字人度晓晓创作的“无界”系列画作,已被专业美院教授评价为“已经达到了本科美术生的基本要求”。
业内人士指出,对于 AI 绘画而言,如何让 AI 准确理解中英文语境中的描述语至关重要。描述语不仅有中英文上的语言差异,也有语言承载的文化差异,从而影响到 AI 绘画技术的研发。
例如“龙”对于英文环境基本没有歧义,但在中文环境中则有东方龙和西方龙的形象差异,且东方龙和西方龙作为文化符号的意义也完全不同,这对 AI 绘画技术提出了很大的挑战。
从当下来看,如何处理好语言、文化的差异,AI 绘画还有很长的路要走。
03、AI 绘画的争议点和未来发展
AI 绘画诞生后,市场上存在的一个争议点主要围绕版权展开。
AI 绘画平台的底层逻辑是融合各创作者的作品以及现有的互联网图片生成的作品,提取原作的笔触、用色、构图等元素而进行的“二次创作”,至于版权是归原作者、平台方,还是现在的创作者,目前尚难以界定。
据使用过 Disco Diffusion 和 MidJourney 的用户介绍,用 Disco Diffusion 生成的图片版权属于创作者自己所有,而使用 MidJourney 生成的图片版权则属于创作者与平台共有。
百度文心一格相关负责人认为,AI 技术生成的图片并不是既有图片的拼凑,而是类似人类经过长期绘画训练后的再创作,既有继承,也有自己的特色。
不过基于版权问题,行业仍在讨论中,为了避免可能的风险以及解决可能发生的纠纷,百度文心一格方面就表示,未来如果平台开放出来的生成图片侵犯到原作者权益,会提供投诉反馈通道,为相关权利人提供权利救济渠道,迅速处理。
据了解,目前国内还无相关具体的法律案例能够用来作参考。
关于 AI 绘画的发展方向,本质是 AIGC(人工智能自主生成内容)技术的发展,它是一种继 PGC、UGC 之后全新的内容生产方式,被认为能够刺激内容产业进一步发展。
公开数据显示,全球库存图片市场规模接近 3000 亿美元。但目前主流的图片市场是平台有什么用户用什么,而不是用户想要什么就有什么。内容生产者仍然受限于生产的想象力,传统图片行业还处于“数字手工业”阶段。
相较之下,AIGC 的发展正好顺应了内容创作者对生产想象力的延伸。以前 AI 只是辅助内容创作的工具,现在 AI 已经能够独立完成写作、设计、绘画、作曲等创意性工作。
这里需要注意的一点是,AIGC 听上去时髦,但自动化内容生成并不是一个很新的概念。
利用计算机辅助人类进行内容生产早已经出现,比如在计算机编程领域 IDE 的代码提示、使用 Office Word 编辑内容的错误修正,再到后来利用 NLG 自动化文本生成等都可以算在这个范围里。
关于目前的 AIGC 技术处于哪个发展阶段,百度 CEO 李彦宏在 2022 年百度世界大会上有一个论述。
他将 AIGC 分为三个发展阶段:第一阶段是助手阶段,AIGC 辅助人类进行内容生产;第二阶段是协作阶段,AIGC 以虚实并存的虚拟人形态出现,形成人机共生的局面;第三阶段是原创阶段,AIGC 将独立完成内容创作。
从目前 AI 在作文、绘画、写歌等各个领域的发展来看,AIGC 已经进入助手阶段,但总体处于发展早期。
未来 AI 作画是否会取代设计师、原画师等,这个还说不定。但从目前人们的反应来看,人们显然还没有那么忧虑。
本文来自微信公众号:真故研究室 (ID:zhengulab),作者:郑思芳,编辑:龚正
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。