未来可期|Sora引领下的文生视频时代:技术革新与产业创新

胡逸
2024-03-04 12:16
来源:澎湃新闻

在这个不断变化的世界里,人工智能(AI)技术就像是一位魔法师,每次挥动魔杖都带给我们新的惊喜。

最近,它的一个新把戏是文生视频,其中Sora平台的推出尤为引人注目。只需输入你想要的视频内容,AI就能创造出让你目瞪口呆的视频——从大片级别的电影场景,到让人捧腹的动画短片,应有尽有。是的,你没看错:以Sora为代表的AI技术现在不仅是文字高手,能写出让人一笑倒地的段子;它还是视频大师,能制作让人眼睛一亮的视频。随着这项技术的飞速发展,我们的视觉体验和创作方式都在经历一场革命。

2023年7月,网络爆红了一段全AI生成的混搭电影预告片——《芭本海默》(Barbenheimer)。这段预告片结合了电影《芭比》与《奥本海默》的元素,震撼效果堪比好莱坞大作。稍有缺憾的是,角色动作略显僵硬,缺乏生命感,画面细节也有待提升。但这段预告片无疑展示了人工智能生成内容(Artificial Intelligence Generated Content,简称AIGC)技术迅猛的进化速度。

《芭本海默》的创作者Curious Refuge是一位热爱探索的网络创作者。他使用了Midjourney和Runway的Gen-2技术合成视频,甚至连配音都是AI生成的,模仿了玛格特·罗比和马特·达蒙的声线。令人惊讶的是,整个项目仅用一台标准的MacBook Pro,在短短4天内完成。

以预告片中令人印象深刻的粉色蘑菇云为例,Curious Refuge先是用Midjourney创造了一张粉色原子弹爆炸图像,随后将这张图上传至Gen-2服务器。无需任何额外的提示,瞬间就生成了4秒钟震撼的电影场景。

这一切都指向了一个激动人心的未来:即便是在我们的家用电脑上,也能创作出令人瞩目的影视作品。AIGC正在重塑内容创作领域,一个新的产业——全AI电影制作,或许就此诞生。这意味着,不久的将来,我们每个人都有可能成为电影导演,用键盘和鼠标编织出自己的电影梦。

想象一下,有一天你坐在家里,灵感突现,你决定制作一部电影。你不需要找到一组演员,也不必担心场地和天气。你只需要和你的AI伙伴沟通,它能理解你的构想,并迅速将它们变为现实。传统上,一部电影的诞生需要庞大的团队、昂贵的设备和漫长的时间。现在,只需几天时间,一台笔记本电脑,加上无限的想象力,任何人都能创造出视觉效果惊人的短片。

在全AI电影制作这条道路上,有一些先行者正在为这个梦想铺路。Pika(https://pika.art/)的出现,便是另一个生动的案例。这是一个由两位斯坦福大学博士生创立的项目。他们觉得之前的制作视频对于普通人而言,实在太过复杂。因此,他们决定让视频创作变得简单,让任何人都能轻松地按需创作视频。

Pika1.0的功能十分强大,可以根据用户输入的文本提示词,生成各种风格的视频,包括3D 动画、动漫卡通以及电影等。它还有一个独特的功能,就是可以让用户修改视频的特定区域,而不需要重新生成整个视频。例如,它调整视频的宽高比、更改视频中人物的衣服,给猩猩戴墨镜……

2024年2月16日,OpenAI发布了革命性的文生视频模型——Sora (https://openai.com/sora),再次引发了行业内的巨大震动。Sora不仅能够生成长达60秒的视频,而且展现了精细的背景、复杂的镜头运用和充满情感的角色表现,这一能力远远超出了上文提到的Runway和Pika。

尽管Sora极具创新,但它也有自己的局限。OpenAI自己也承认,Sora在模拟复杂场景的物理原理上可能会遇到困难,对因果关系的理解也不尽完美。比如,角色吃饼干后,饼干可能仍然完整无损;玻璃破碎的细节也可能无法精确再现。

Sora的发布被一些人士视为内容创作领域的“牛顿时刻”。YouTube博主Paddy Galloway表达了他对Sora的震撼之情:“在YouTube世界沉浸了15年后,OpenAI的这一展示让我哑口无言……动画师和3D艺术家可能要面临挑战,素材库可能变得不再重要。现在,任何人都能够轻松获得令人难以置信的创作成果,故事背后的‘想法’变得尤为重要。”这一评价不仅凸显了Sora带来的巨大变革,也预示着内容创作行业的未来正在发生深刻变化。

当我目睹Pika、Sora这些平台时,我首先想到的是:未来的短视频领域,将主要由文生视频占领。这对现有的短剧市场既是巨大的推动力,也带来了前所未有的冲击。在当前,视频市场由“爱腾优芒”这样的巨头占据优势。不久的将来,谁拥有独特的故事,无论是动人的人生经历,还是奇幻的虚构世界,都有机会成为视频平台的新霸主。

尽管人工智能能够制作出高质量的视频,但视频的灵魂——主题思想、脚本构思、镜头安排、对白搭配,这些都离不开人类的创意火花。至少目前来看,人工智能还需要依赖于人给出的提示词来创作。这一点,再次凸显了人类创造力的不可替代性。在AI和人类协作的新时代,那些能够将技术与人性故事完美融合的创作者,将引领着未来短视频的潮流。

如果我的推断成真,文学网站如起点中文网、纵横中文网、番茄小说和晋江文学城等,可能会成为新一代的视频巨头,成为未来的“爱腾优芒”。他们手中握有的庞大文本资源,将成为制作新一轮流行视频的宝贵资产。

首先,这些文学平台需要做的是利用人工智能技术,全面了解现有的影视内容,包括在“爱腾优芒”上发布的所有电影、电视剧和综艺节目,以及抖音、快手等平台上的热门视频。紧接着,将这些丰富的文本资料交给AI,让它创造出全新的电影和电视剧内容。尽管目前的技术限制AI只能生成时长为60秒的短视频,完全由AI制作的长篇电影和电视剧似乎还遥不可及。但我们不能忽视技术发展的潜力。随着时间的推移和技术的进步,那些曾在文学平台上流连忘返的小说,可能真的一跃成为观众瞩目的大片。

文生视频平台的出现,使得没有视频制作经验的人也能轻松将创意变为现实。这是AI技术带给内容创作领域的革命性变化:技术门槛的降低,让更多想法得以实现。借助Sora、Pika等平台,我们看到了一个用户驱动的创作生态的崛起。这里,每个人都有机会让自己的梦想和故事跃然屏幕之上。技术的复杂度不再构成障碍,这无疑将推动创意自由和文化多样性的发展。

因此,全AI电影制作不仅仅是关于技术的革命。它还代表了一种创意的民主化,让更多的声音有机会被听见。在这个新时代,无论你来自何方,背景如何,只要你有故事要讲,AI都能帮你把它变成现实。

在AI的前一轮技术浪潮中,我们见证了决策式AI如何通过算法优化提升效率,满足市场和消费者对于快速匹配和推荐的需求。打车服务、旅游推荐和购物平台等得到了长足的发展。而现在,生成式AI的兴起标志着一个新时代的到来——不仅仅满足既有需求,更是创造全新的供给。这种供给不仅仅局限于传统的文本、图片生成,它延伸到新闻报道、广告文案、视频内容、游戏设计,甚至编程和影视创作等多个领域。

这就是为什么在2024年杭州市新春第一会——“深化改革、强基固本”主题年推进大会上,杭州市委书记刘捷会两次提到Sora大模型:“Sora大模型为数字经济创新发展打开了一扇大门,形成了引领人工智能产业发展的一个新的通道,这不仅带来很大启发,更大地带来了产业的冲击”。Sora的出现,不仅仅是技术上的一大步,更标志着新供给的诞生,引领了人工智能产业的全新发展方向。

Sora等平台为内容创造者和技术开发者提供了革命性的工具,开启了内容创作的新纪元;同时,它们也为数字经济注入了新的活力和竞争领域,赋予了企业和创作者空前的机遇。这场从需求驱动到供给创新的变革,预示着未来产业的发展将更依赖于创新力和创造力。生成式AI的应用正催生着众多全新的产业机会,从内容创作到智能编程,从娱乐媒体到教育培训,每一个领域都将迎来变革。随着新供给的不断涌现,我们有理由期待一个更加多元化、更加活跃的数字经济生态系统的形成。

让我们进一步拓展想象:当AI掌握了电影制作的魔法,游戏创造的王国也将很快纳入它的版图。假如这种技术与Vision Pro这样的硬件设备联姻,我们又将站在什么样的新起点上?想象一下,未来的游戏行业,不再是少数大型游戏公司的专属战场,而是成为广大游戏爱好者、独立开发者乃至任何有想法的人的创作乐园。这种变革,就像手握阿拉丁的神灯,可以释放出无限的可能性。

(作者胡逸,一个喜欢畅想未来的大数据工作者。“未来可期”是胡逸在澎湃科技开设的独家专栏。)

    责任编辑:吴跃伟
    图片编辑:张同泽
    校对:施鋆