前OpenAI研究科学家加盟腾讯,推动混元AI模型重大升级
腾讯近日更新了其混元AI模型,这也是自腾讯成功招募前OpenAI顶尖AI科学家姚顺宇(Yao Shunyu)以来的首次重大版本发布。目前已进入预览阶段的混元Hy3模型,在复杂推理、代码生成等多个维度上均有显著提升。
作为中国科技巨头之一,腾讯正在加速追赶字节跳动、阿里巴巴和DeepSeek等国内AI竞争对手。当前,中国正大力押注开源AI路线,意图为美国主流大语言模型提供替代选择。早在2023年,腾讯就曾声称当时新推出的混元大语言模型,在能力和智能水平上已超越同期版本的ChatGPT与Llama。
在生态布局方面,腾讯已投资月之暗面(Moonshot AI)、阶跃星辰(StepFun)等AI初创公司,寄望借此带动旗下云计算业务的增长。与此同时,腾讯还对研究团队架构进行了调整,以提升训练数据的质量。据悉,腾讯计划今年将AI投入翻倍,总额超过50亿美元。
另一边,DeepSeek也不甘示弱,正式发布了旗下大语言模型的最新版本——V4 Flash系列与V4 Pro系列。DeepSeek凭借2025年1月推出的R1 AI模型一夜成名,此后持续推进模型迭代。DeepSeek表示,V4系列升级版将在推理能力和智能体任务处理上带来显著进步,同时新引入的混合注意力架构(Hybrid Attention Architecture)功能,将大幅增强AI平台对长对话中历史查询内容的记忆能力。
Q&A
Q1:腾讯混元Hy3模型有哪些主要提升?
A:腾讯混元Hy3模型目前处于预览阶段,相较于此前版本,在复杂推理、代码生成等核心能力上有明显进步。此次更新也是腾讯招募前OpenAI研究科学家姚顺宇后的首次重大发布,标志着腾讯在AI研发投入上进一步提速。
Q2:腾讯在AI领域的投资和布局是怎样的?
A:腾讯已投资月之暗面、阶跃星辰等AI初创公司,希望借此推动云计算业务发展。公司还对研究团队进行了架构调整,以提升训练数据质量,并计划今年将AI投资翻倍,总额超过50亿美元。
Q3:DeepSeek V4系列模型有什么新特性?
A:DeepSeek V4系列分为Flash和Pro两个版本,在推理能力和智能体任务处理上有所提升。其中一项名为混合注意力架构(Hybrid Attention Architecture)的新功能,能够增强AI平台对长对话中历史查询内容的记忆能力,改善用户在长对话场景下的使用体验。

