周鸿祎：Sora意味着实现通用人工智能可能从10年缩短至1年

澎湃新闻记者范佳来

2024-02-16 18:21

来源：澎湃新闻

“Sora只是小试牛刀，它展现的不仅仅是一个视频制作的能力，而是大模型对真实世界有了理解和模拟之后，会带来新的成果和突破。”

2月16日，360创始人周鸿祎发布微博提到自己对Sora的看法，周鸿祎认为，Sora的诞生意味着AGI（通用人工智能）实现可能从10年缩短至一两年。

当地时间2月15日，OpenAI宣布，正在研发“文生视频”模型Sora，可以创建长达60秒的视频，其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色，也可以根据静态图像制作动画。

周鸿祎认为，科技竞争最终比拼的是让人才密度和深厚积累，“很多人说Sora的效果吊打Pika和Runway。这很正常，和创业者团队比，OpenAl这种有核心技术的公司实力还是非常强劲的。有人认为有了AI以后创业公司只需要做个体户就行，实际今天再次证明这种想法是非常可笑的。”

此外，AI不一定那么快颠覆所有行业，但它能激发更多人的创作力。周鸿祎表示，很多人担心Sora对影视工业的打击，在他看来，机器能生产一个好视频，但视频的主题、脚本和分镜头策划、台词的配合，都需要人的创意，至少需要人给提示词。一个视频或者电影是由无数个60秒组成的。今天Sora可能给广告业、电影预告片、短视频行业带来巨大的颠覆，但它不一定那么快击败TikTok，更可能成为TikTok的创作工具。

谈到Sora最大的优势，周鸿祎表示，以往文生视频软件都是在2D平面上对图形元素进行操作，可以把视频看成是多个真实图片的组合，并没有真正掌握这个世界的知识。但Sora产生的视频里，它能像人一样理解坦克是有巨大冲击力的，坦克能撞毁汽车，而不会出现汽车撞毁坦克这样的情况，“这次OpenAI利用它的大语言模型优势，让Sora实现了对现实世界的理解和对世界的模拟两层能力，这样产生的视频才是真实的，才能跳出2D的范围模拟真实的物理世界。”

周鸿祎提到，有了大模型技术作为基础，再加上人类知识的引导，可以创造各个领域的超级工具，例如在生物医学、蛋白质、基因研究，包括物理、化学、数学的学科研究上，大模型都会发挥作用。

“一旦人工智能接上摄像头，把所有的电影都看一遍，把YouTube上和 TikTok 的视频都看一遍，对世界的理解将远远超过文字学习，一幅图胜过千言万语，这就离AGI真的就不远了，不是10年20年的问题，可能一两年很快就可以实现。”周鸿祎感慨。

他还提到，尽管国内大模型发展水平表面看已经接近GPT-3.5，但实际上跟4.0比还有一年半的差距。OpenAl手里应该还有一些秘密武器，无论是GPT-5，还是机器自我学习自动产生内容，“奥特曼（OpenAI CEO）是个营销大师，知道怎样掌握节奏，他们手里的武器并没有全拿出来。这样看来中国跟美国的AI差距可能还在加大。”

责任编辑：孙扶

图片编辑：朱伟辉

校对：张艳