国产AI不要“百模大战”,要先认清美国源头创新的方法论

周路明
2024-03-27 14:37
来源:澎湃新闻

近期,美国人工智能源头创新的成果迭出,先是GPT(Generative Pre-Trained Transformer,生成式预训练模型),然后是SORA(美国人工智能研究公司OpenAI发布的人工智能文生视频大模型),每一轮都搅动着中国科研、产业界的神经。但大家讨论的焦点都放在了诸如:中国和美国在人工智能源头创新方面到底相差几年,我们会不会在人工智能领域形成新一轮的“卡脖子”问题,等等。这些看似“重大”的问题,其实搞错了焦点。

人工智能源头创新是长期的系统工程

首先,争论中美人工智能源头创新的差距到底有几年意义不大,这种差距不是通过政策调整和增加资金投入能够解决的问题,它由国家教育的基本面决定,该基本面包括教育系统的构建方式、治理方式等。教育系统输出什么样的人才,决定了源头创新所能企及的高度。 

中国教育系统的构建过程不同于西方发达国家,它不是在市场经济和工业企业发育到一定程度,基于大量知识和技术需求所建,而是在市场经济和工业企业还不曾出现的时候开始教育系统的构建,这导致中国的教育从一开始就把追求知识变成终极目标,严重脱离真实世界(自然界、社会、经济),而重大的源头创新成果绝大部分都是基于对人类文明进化过程中产生的重大需求提出的科学问题所产生。中国的科学家提不出好问题,不是知识不够,是因为对人类命运进化重大进程缺乏应有的情怀和兴趣。中国教育培养的知识分子变成了“纯粹的知识分子”。 

另外,由于中国教育系统的构建由政府主导,政府也理所当然成为教育系统的治理者,这导致了知识系统在管理方面的高度行政化,这类问题大家以往探讨得足够多,无须重复。

需要强调的是,知识系统治理方式的高度行政化反过来强化了教育脱离真实世界的倾向。当今中国教育的基本面,我们在短期内还看不到根本转变的可能性,即便就是现在启动重大的体制机制改革,要完成这种彻底的转变也需要10-20年的时间。所以,中国教育的基本面决定了中国在源头创新领域落后于美国将是一个长期的现象。这是我们未来二十年搞科技创新需要了解的一个基本面,空谈口号于事无补,只会误导决策并导致资源错配。 

其次,中美在人工智能领域源头创新的差距,会不会导致中国形成新一轮的被“卡脖子”现象?我的回答是:不会。现代产业核心技术的形成由两方面因素构成,一是知识产权的壁垒,也就是我们所说的技术问题;二是技术生态,只有大量的用户接入这个技术生态,它才能成为产业的核心技术。技术生态壁垒往往比技术壁垒重要得多,也是更难跨越的壁垒。中国之所以在芯片、操作系统等方面被“卡脖子”,是因为我们毫无防备地接入了跨国公司的技术生态,形成了依赖性。美国发起科技战之后,全球技术生态已无可挽回地断裂成为不同的板块,美国人不让中国接入新的技术生态,所以出现过往“卡脖子”情况的概率变得很小。 

此外,核心技术落后的担忧,部分源于我们对核心技术形成路径的片面认识,以为成果转化的路径模式才是核心技术形成的必由之路,这种路径依赖已经支配了中国科技战略政策设计者、科学家和部分企业家数十年。GPT问世之后,中国举国紧张,搞出个“百模大战”,但GPT很快又有被新事物取代的趋势。中国人工智能发展如果完全跟着美国起舞,结果恐怕很糟糕。 

其实,现代产业核心技术的绝大部分都是企业围绕产业问题、市场需求开展应用端的研发逐步形成。过去二十年,在电动汽车产业的发展过程中,国内产学研围绕产业的真问题开展产学研协同,用并联分工的方式解决产业提出的各种问题,在电池、电控等系统的关键环节形成了领先全球的核心技术。这对纠正国内核心技术发展的路径依赖是一个很有说服力的案例。 

眼前需要关注哪些问题

人工智能领域的爆炸性发展正在产生一系列颠覆性的变革,我们真正需要关注的是以下几个问题: 

1、人工智能创新的方法论 

中美在源头创新方面的真正差距不是技术,不是知识,不是金钱,是方法论层面的差距。GPT出来之后,中国很快搞出来一堆高仿GPT,在技术指标上也能接近到七八成,这说明中国的技术和知识储备应该是够的,论文数量世界第一也不是虚有其表。且研究人工智能是个花钱的买卖,不是所有国家都能玩得起,中国能承受其花费。但美国人为什么能搞出GPT,背后的方法论是什么?方法论层面的差距,本质上是教育的基本面决定的,短期很难改变。但关注方法论层面的问题,采用活学活用的方法,依然对现实的人工智能发展有重要指导作用。 

这一轮美国人工智能创新在方法论方面出现了一些新的动向,值得我们研究:它不再沿着“基础研究-应用基础研究-开发研究”的线性方式组织源头创新,而是基础研究直接瞄准产业问题开展,把基础研究、应用基础研究、产品研究一整套创新链直接压缩在一个组织(OPEN AI)里,把产学研浓缩在一个产品形态上开展协同。这个动向值得中国研究,如果我们在人工智能领域的创新战略还沿用成果转化那套模式去组织,既浪费钱财,还会错失产业发展机会。中国应该发挥应用端优势,挖掘产业真问题,组织产学研并联式协同创新。 

中国人很喜欢谈方法,喜欢“范式”这个词,因为看起来很高级。但很多时候反被“范式”所累。美国人提出一个“三螺旋”理论,国内一堆人围绕这个玩意画图表、发论文,也培养出很多教授,但没啥用。中国有如此丰富的市场化创新实践,却没有人用费孝通的“江村经济”的研究方法去总结,提炼出符合中国特色的创新范式。

我原来一直认为中国的企业家已经解决了方法论的问题,但在GPT这一轮“大考”中,该结论又变得不太确定。中国的企业家在自由竞争的环境中利用市场奖励机制搞创新已经做得很好,出现了一批国际性大公司,但在“无人区”提出“真”问题方面,依然存在着局限性。

马斯克之所以成为科技创新的世界领袖,他大概是这么思考问题——怎样成为能影响世界的人,而不是当个无趣的有钱人?马斯克在定义创新时思考的绝不是挣钱,而是想改变人类文明进程,这是他方法论的底层逻辑。我们的企业家目前基本上还在市场奖励机制的轨道上创新(这点对中国是好事),但针对源头创新,仅有市场奖励机制还不够,放到时间长河,也许等中国有钱人出现的历史积累到一定时长,这个问题会自然解决。 

2、人工智能对科技创新的影响

自从GPT问世,人类第一次有可能用机器替代科学家的工作,目前已在科学研究的很多领域里发生。这是一个需要我们高度重视的问题,它对中国的科技发展意味着什么,现在还看不太清晰,但一定是个重大的战略问题。

一方面,如果大量的机器科学家替代了人的科学研究,中国科研系统投入产出率不高、诚信问题、小圈子问题、形式主义问题等等,都将迎刃而解,拿着省出的这笔钱去生产更多的机器科学家是不是效果更好?未来,人工智能领域一定会出现大量新的基础设施建设,中国习惯于搞科研大装置建设,但过去的大装置是围绕知识生产,而人工智能时代的大装置是围绕解决实际问题展开,这种需求比较适合中国的科技投入方式,同时也会改善中国科技投入产出的效率。

另一方面,如果机器大量取代科技人员的工作,中国原先对从人口红利过渡到工程师红利的期望会不会落空,这种可能性也需要我们去进一步研究。 

3、人工智能成果应用的速度在加快

GPT这一轮创新在方法论上的变化,也导致一个新趋势:源头创新的成果由于创新链的高度压缩现象,基础研究工作直接奔着产业问题去,源头创新的成果形式已经不是知识形态,而是产品形态,并且先天具备一定的解决问题的能力。过去数百年我们习惯于一个事实:基础研究的成果要走到最终应用需要很多环节,通过不同创新组织接力,经过数十年的努力才能达成。在人工智能时代,这种模式正在被颠覆,人工智能成果应用的速度出现了数量级上的提高。虽然人工智能的源头创新成果要形成成熟的商业模式依然需要一定的时间,但在社会其他领域的应用已经有立竿见影的效果,特别是在军事、情报、网络、金融领域。

俄乌战争中战场单向透明的情形、美国对俄罗斯恐袭相关情报的先知先觉都表明,人工智能源头创新的成果在这些领域的应用速度在加快。人工智能技术的发展正在极大强化美国的无形边疆能力,美国的军工复合体在融合新技术方面具有天然的优势。对于美国人来说,把人工智能作为打击对手的武器,比起用人工智能形成能挣钱的商业模式要容易得多。

未来大国之间发生传统热战的可能性并不高,但美国利用无形边疆能力发动情报、信息、认知、网络、金融等领域的灰色战争的可能性会大大提升。这个问题,我们应该引起高度重视。 

[作者周路明系国家海外人才离岸创新创业基地(深圳)总裁、深圳市源创力离岸创新中心总裁、深圳市源创力清源投资基金董事长,曾任深圳市科技局副局长、深圳清华研究院副院长、深圳市科协主席等职]

    责任编辑:田春玲
    图片编辑:陈飞燕
    校对:刘威