用 AI 给“中文难度 10 级”的古诗词、文言文配插图,会是什么 Style?
B站百万网友会告诉你:堪比“灵魂出窍”,直接绷不住了。
具体啥情况?请各位观众老爷来看 VCR。
现在展示的是李白《将进酒》名场面,这下可是真・300 杯:
这,已经是“很正常”的了。不信来看最“出圈”的诗圣杜甫名篇《茅屋为秋风所破歌》:
此作一出,网友当即给到“最高评价”:
太抽象了,真有艺术细菌,哈尔的移动城堡之杜甫版……
继续往下看,那叫一个触景生情、情不自禁、禁(jing)天动地……
噗!各位观众,看到这里可还蚌得住?
没想到有一天 AI 绘画会以这种“清奇”的姿势被打开。如今在B站,这种玩法已经成为热门创作风向。
这种玩法为什么会火?从网友的点评中可以窥见一二:
“既形象又抽象”、“既写实又魔幻”、“既无厘头又好像很合理”。
今天量子位就在此献上一期特别节目:连线 AI 绘图与国学经典。
俺们也忍不住动手试了试。
“灵魂出窍”的古文插图
上面所展示的作品的原作者曾在评论区透露,创作时使用的是 Midjourney。那咱就也先用 Midjourney 来试试。
这里首先为大伙儿献上《桃花源记》名场面:
晋太元中,武陵人捕鱼为业。
缘溪行,忘路之远近。
忽逢桃花林,夹岸数百步,中无杂树,芳草鲜美,落英缤纷。
渔人甚异之,复前行,欲穷其林。
怎么说?就,很是正常。其实 Midjourney 等工具能生成这种比较“精美”的图,大伙儿可能早前就已经见过很多了。
但关键是,怎么能创作出那种“灵魂出窍”的感觉🤔?有一说一,还是很吃提示词的。
我们在倒腾了很多遍之后,终于使用 GPT-4,get 到了一点“精髓”。
咳咳,白居易的《琵琶行》前来应战。
浔阳江头夜送客,枫叶荻花秋瑟瑟。
主人下马客在船,举酒欲饮无管弦。
醉不成欢惨将别,别时茫茫江浸月。
忽闻水上琵琶声,主人忘归客不发。
接下来直接上高潮:
轻拢慢捻抹复挑,初为霓裳后六幺。
大弦嘈嘈如急雨,小弦切切如私语。
嘈嘈切切错杂弹,大珠小珠落玉盘。
🤣是不是有点那味儿了?
这就来分享一下我们的制作过程。
就拿“浔阳江头夜送客,枫叶荻花秋瑟瑟”这句来说,我们一开始先把它输给了 GPT-4,让 GPT-4 来解析。(虽然 GPT-4 的解析可能还会有点问题,比如“王之涣”,但这里对后面生成图片影响不大)
然后加上自己的提示词:
请你根据上面这首古诗的描述帮我生成 1 幅符合意境的画面,要求画面夸张和抽象,输出图像尺寸 16:9。
根据这样的提示词,GPT-4 生成的图片,可以说不仅正常,而且很“美”:
同样的提示词,再尝试一遍,依旧很不戳:
接下来,让整个图片风格“异变”,其实只需要加上一点“调料”:
请你根据上面这首古诗的描述帮我生成 1 幅符合意境的画面,要求画面夸张、抽象、拟人化、具有幽默感,输出图像尺寸 16:9。
GPT-4 这回直接像是“喝大了”🍺,很是上头:
和之前完全是两种感觉:
一个词就可能让模型整个输出朝向完全不同的方向,难怪 ChatGPT 等爆火之后,会出现“提示词工程师”这类新职业。
除了这种玩法,我们还尝试不逐句 prompt,直接让 GPT-4 根据《醉翁亭记》中的一段话,生成连环画:
你还别说,你还真别说……
当然也可以有更多玩法,比如根据 AI 绘出来的图猜猜这是哪句诗?
搭配上 AI 视频工具,静止的画面也可以动起来:
写在最后
这类视频在B站爆火之后,正如开头提到的,不少网友评论 AI 绘制的配图“无厘头”中透着合理,“既形象又抽象”。
更有甚者表示,想当年背书那会儿脑子里就是这种画面。
有人认为观看这种图片,可以加强对古文的记忆,也有人认为 AI 绘画不能“过度”无厘头解读诗词。
值得一提的是,文章开头视频作者、B站up 主 @当铺小说家也在相关视频评论区置顶了一段话,其中写到:
趣味同时不逾矩,雅致而又知分寸。
那么家人们喜欢这类作品吗?还有上面根据 AI 绘出来的图猜是哪句诗,应该很好猜吧?
本文来自微信公众号:量子位 (ID:QbitAI),作者:西风
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。