从小模型到大模型,专用智能走向通用智能有哪些技术路线?

澎湃新闻记者 张静
2024-03-22 17:02
来源:澎湃新闻

·面向未来的通用人工智能,有两条发展路线,一是延续大模型路线,二是探索强化学习、知识计算、符号推理、类脑计算及其他新型路径。

·未来的创新将不再是某一个环节的简单创新,大模型创新涉及芯片、互联、框架、数据、模型、评测、部署等环节,可多环节协同、体系化创新,实现全链条优化,弥补单环节劣势。

上海人工智能实验室主任助理、领军科学家乔宇。

“我们正处于专用智能时代到通用智能时代的关键阶段。”3月22日,在2024年上海市产业技术创新大会上,上海人工智能实验室主任助理、领军科学家乔宇表示,面向未来的通用人工智能,有两条发展路线,一是延续大模型路线,用更大的算力扩大模型规模,拓宽能力边界,向产业渗透;二是探索强化学习、知识计算、符号推理、类脑计算及其他新型路径。这两条技术路选并非孤立和互相替代的,而是要通过探索新的技术路线解决大模型现有路线中的固有问题。

乔宇表示,2010年左右的深度学习方法驱动了一轮人工智能浪潮。最初十年,人工智能行业针对不同任务开发专用小模型。“那时候大部分研发由应用问题驱动,针对不同问题收集数据、训练模型,所以是分散式、多团队的研发。”

到2020年左右,Transformer+大数据+自监督学习的大模型路线使得智能涌现,一个模型可以应对多种任务。在大模型时代,OpenAI找到了“大工程+大创新”的道路,工业化集中研发才得以产生ChatGPT、GPT-4。

面向未来的通用人工智能,他认为有两条发展路线。

一是延续大模型路线,用更大的算力扩大模型规模,拓宽能力边界,向产业渗透,模型也从语言大模型向多模态大模型、具身大模型的方向发展。多模态大模型是现在的竞争热点,未来的大模型要能和物理世界交流,完成更复杂的任务,所以具身大模型是重要发展方向。

但单纯扩大规模,存在幻觉、效率、可信、安全等瓶颈,“现在让一个大模型做一个奥数题和计算2+2这样简单的算术题,需要的运算量、运算次数是一样的。所以,我们能否把大模型做得更安全、更高效,更好解决现在存在的一些瓶颈?”

这就涉及到了第二条新技术路线的探索,要探索强化学习、知识计算、符号推理、类脑计算及其他新型路径。乔宇表示,基于知识、符号、推理的方法,可解释性和安全性非常强,把这些方法结合起来形成更强大的功能,是未来AI发展的重要趋势之一。

这两条技术路选并非孤立和互相替代的,乔宇认为,要通过探索新的技术路线解决大模型现有路线中的固有问题。与此同时,未来的创新将不再是某一个环节的简单创新,大模型创新涉及芯片、互联、框架、数据、模型、评测、部署等多个环节,可多环节协同、体系化创新,实现全链条优化,弥补单环节劣势。“大工程+创新链+产业链”,这种融合式的创新、与知名高校合作,是未来更重要的趋势。

当前,中国大模型发展面临技术和生态的双重挑战。上海拥有金融、城市、制造等丰富的B端场景,他建议联合领军企业研发垂类模型,加快构建开源生态反馈机制,打造大模型伦理安全评测体系,促进健康发展和规范应用。

    责任编辑:宦艳红