这几天玩了 Heygen的虚拟形象,制作了一个自己的虚拟化身尝试做了一些内容。 和年初开始用的Synthesia类似,不同的是Heygen可以免费定制自己的化身 (Synthesia 也可以定制,但价格要贵很多,上次offer 的价格是 $1000初次训练,完了每年还得交年费)。

但做了一些下来,就觉得有些不那么对劲。虽然虚拟的我,用和我差不多的腔调流利地讲各种语言,但是缺少了一种灵气。 这和最初用Synthesia 的感觉是一样的, 一开始觉得太赞了,以后再也不为录视频舌头打结发愁了,再也不愁要去hire个演员了,但很快就觉得这种 AI 生产的东西产生是快的,看起来却很厌烦。
在其它一些视频平台上偶尔刷到一些 AI 产生的内容,一旦我发现是 AI 的,我基本是立刻反感地不看了, 为什么? 因为觉得没有必要浪费时间给自动生成的东西,无论看起来多精美,说话多流利,我宁可看一个真人不完美的介绍。
这其实让我想起听现场演出会和听音响的区别,虽然大多数现场演出的音响一定是充满嘈杂音,现场的表演大概率没有录音棚的精致完美, 但是现场的感觉和听录音回放的效果完全不同。 AI 的视频和真人视频的区别当然不能和演出类比, 但从心理的感受有异曲同工之妙。
AI 视频可能会带来一个“物极必反”的效果,大家以后越来越不那么在意和要求“完美”的视频了,而是要求“真实”的, 这样一来对 AI 产生的视频的需求又下降了。 可能真正比较有价值的是“自动翻译”, 也就是我用一种语言来录制,自动产生多语言的版本,这个目前 Heygen 也提供了, 但我测试下来效果还相当不完美。