周鸿祎谈中国大模型发展:应扬长避短选择适合自己的道路
11月20日,2024年世界互联网大会乌镇峰会在浙江乌镇开幕。在下午的主论坛上,360集团创始人周鸿祎在发言中指出,未来大模型会形成两条发展路线,一条是模型越做越大,继续探索超级人工智能的发展方向;另一条则是向着垂直化、产业化的方向发展,“建议我国扬长避短,选择适合自己发展的道路”。
2024年11月20日,浙江嘉兴,2024年世界互联网大会乌镇峰会主论坛在乌镇开幕。360集团创始人周鸿祎发言。视觉中国 图
周鸿祎认为,大模型的横空出世会带来一场智能革命,席卷、重组所有行业,成为新一轮工业革命的驱动引擎。他指出,虽然我国大模型产业已经跻身全球领先行列,但在新算力芯片公开数据上还面临一定的制约,建议要扬长避短,选择适合中国发展的道路。
“随着对大模型的认知的深入,最近我越来越怀疑OpenAI试图打造一个全知全能、像神一样的超级通用大模型的可能性,一方面,人类的训练数据已经基本用得差不多了,规模定律遭遇了巨大的瓶颈;另一方面,想开发一个大模型一统江湖,解决不同企业、不同国家、不同用户的所有问题的目标在逻辑上也很难自洽。”周鸿祎认为,未来大模型会形成两条发展路线,一条路是模型越做越大,继续探索超级人工智能的发展方向,探索人类的星辰大海,“有点像造原子弹”;另一条路是把大模型和具体场景相结合,向着垂直化、产业化的方向发展。
他表示,走专业大模型之路就不需要“卷”算力和数据,只需在一个百亿参数甚至几十亿参数的通用大模型的基础之上,结合垂直领域的高密度高质量知识进行训练即可,“这样就能把大模型拉下神坛,从原子弹变为茶叶蛋”,而后者更适合中国大模型产业发展。
对此,周鸿祎提出了大模型的“六大应用场景”,首先是科技平权下的人人普惠、人人智能,结合个人需求,消除数字鸿沟;第二是万物智能,大到智能网联车,小到个人电脑和手机,大模型将成为硬件设备标配;第三是助力国家最重视的传统制造业、传统行业“数转智改”,将大模型与具体的业务场景结合起来打造专业大模型解决专业问题;第四是赋能新兴产业、未来产业,充分发挥大模型的能力,变不可能为可能;第五是AI for Science,利用AI改变基础科学问题的研究方法;最后是重视大模型带来的安全问题。周鸿祎介绍,在实践中,360集团训练了行业内首个安全大模型,既能提升传统的安全能力,又实现了以模治模,“以魔法对付魔法的设想,为攻克AI大模型本身的安全挑战提供了可行的方案”。