当初用 Sora 制作气球人的团队分享了一些使用 Sora 的背后经验:《Actually Using SORA》,实际使用 https://t.co/7adUgdNVeK 。
这段话基本上概括了 Sora 使用过程中的优缺点:
> “能够尝试使用 SORA 确实非常吸引人,”Patrick 说。“它是一个非常强大的工具,我们已经在想象它能以各种方式融入我们现有的流程中。不过,我认为无论是哪种生成式 AI 工具,控制始终是最受期待也最难以实现的部分。”
简单来说就是强大,但是难以控制!
用户界面应该是类似于 DALL-E,艺术家可以输入文本提示,随后 OpenAI 的 ChatGPT 将这些提示转化为更详细的描述,用以激活剪辑生成过程。当前界面仅支持文本输入,尚未支持图像视频的多模态输入。
这也就是说 Sora 无法根据对已经生成的视频二次生成修改,只能是每次不停的调整提示词,但是即使同样的提示词每次生成的结果也可能会不同。就像玩赌博机,你不知道下一次生成的结果会是什么。
Sora 生成的视频分辨率不高,支持 480P 和 720P,据说1080P已经上线,但团队为了速度,都是生成的 480P 的原始素材剪辑,然后借助外部工具提升分辨率。
Sora 生成速度倒是挺快,一般10到20分钟就可以生成3到20秒的视频。
由于生成结果太难以控制,所以要生成大量的视频后期剪辑,1 分钟半的气球人视频 ,实际上背后是几百个 Sora 生成的结果剪辑合成出来的,素材和最终结果的比例大约是 300 : 1!
Sora 对于版权保护很严格,例如,如果有人请求创建像是 在未来太空船中,一个男人持着光剑走来 这样的场景,SORA 将不会生成此内容,因为它与 星球大战 过于相似。
最后直接摘录原文的总结:
SORA 是一个非凡的创造;Shy Kids 团队在短短 1.5 到 2 周内,仅由三人完成了 Air Head 的制作。团队正在创作一个既自我觉醒又带有讽刺色彩的续集。“续集将采用新闻报道的形式,聚焦气球艺人 Sonny 对名声的反应及其与世界渐行渐远的故事,”Patrick 表示。“我们还在尝试新的技术手段!”团队计划在实验中加强技术层面,将 SORA 元素与实际动作画面进行 Adobe After Effects 合成,并将 SORA 作为补充的视觉效果工具使用。
SORA 还很新,即便是 OpenAI 展示的基本框架也尚未面向初步测试开放。目前 SORA 的版本似乎短期内不会发布,但它在隐式图像生成的特定领域已取得了巨大进步。对于高端项目,达到导演所需的具体性水平可能还需要一段时间。然而,对于许多其他项目而言,它已能提供超出预期的惊艳图像。尽管 Air Head 仍需大量编辑和人工指导才能完成这部充满趣味的故事片,但“我认为人们应将 SORA 真实地纳入他们的创作流程中;当然,如果他们选择不这样做,也完全可以。”
原文:https://t.co/7adUgdNVeK
译文:https://t.co/s2A1a2hok0
点击图片查看原图
点击图片查看原图
点击图片查看原图
点击图片查看原图