后续: 评估一下Dall-E 3 中文诗歌作画能力

Robert’s MetaMask
2023年10月4日
cover


8 个月前,我评估比较了一下AIGC 工具 Dall E2 和 Mid Journey 的文生图能力,故意用古诗来“刁难”了它们。 当时我的判断是 Dall E 更合适,虽然它产生的图质量差一些,但是对prompt的理解更正确。

“枯藤 老树 昏鸦” 看AIGC如何画
用马致远这首诗来让AIGC画画看。 这首诗的中文意境特别美,读诗的时候就相当于让人脑来响应词句构画出场景,这点我觉得特别适合考验AIGC。 天净沙·秋思作者:马致远 年代:元枯藤老树昏鸦,  小桥流水人家,   古道西风瘦马。   夕阳西下,  断肠人在天涯。结果令人惊讶,我觉得 Dall E 完胜
favicon
https://www.robertmao.com/comments/blog/en/ca460aad-78cb-4db5-9018-379259597f59
用更多中文诗歌来考验 Dall E
更多诗歌考验 Dall E。 MJ 出的图我就不放了,实在上不了台面,属于“没有文化”的 😊。“日照香炉生紫烟,遥看瀑布挂前川。飞流直下三千尺,疑是银河落九天”远上寒山石径斜,白云生处有人家;停车坐爱枫林晚,霜叶红于二月花。题图为这首诗的水墨画版本,也非常赞。 👍去年今日此门中,人面桃花相映红,
favicon
https://www.robertmao.com/comments/blog/en/3189b256-8f28-443b-a259-18116b31437b

进而在我们的产品中采用哪种AIGC 引擎,我也比较评估了一下, 还是选择了用Dall-E。

AIGC 文章插图用 Midjourney 还是 Dall-E? 一个实验比较
这是一个实验,用 Midjourney 来替代目前我们AIKit内置的 Dall-E 来用相同的prompt产生文章插图。我们的Discuss Kit 对AI Kit 的支持有一个有趣的新特性: 在写文章的时候,能通过 AIGC 来直接产生需要的配图,目前还在实验阶段,但是感兴趣的同学可以尝试了。
favicon
https://www.robertmao.com/comments/blog/en/d2adc77d-5fa3-45a7-aeef-cdea0a98103d

如今 Dall-E 3 出来了 (目前还得通过微软的 Bing 来获得,但期望十月份,能通过API 集成,这样ArcBlock的产品里也全面升级为支持 Dall E 3), 再次来考验了它一下。


并不惊讶,直接全诗还是不太行。 显然可以看到Bing 是先翻译为英文再产生图片的:

image.png

但给一些更好的提示预处理,出来的效果相当惊艳:

image.png

Prompt:A withered vine, an old tree, a cawing crow, a small bridge, the flowing water, and a lonely cottage home of a small village, sunset, . Chinese classical painting.

image.png

Prompt: A man, a horse, a long narrow path, desolate, rugged, windswept, lonely, melancholy, despondent, sunset, Chinese classical painting.


如果两句prompt 合并起来,输出:

image.png

这一张我觉得最贴切:

Image

你获得 0 积分