前OpenAI研究科学家加盟腾讯，推动混元AI模型重大升级

2026-05-01 12:37

天津

腾讯近日更新了其混元AI模型，这也是自腾讯成功招募前OpenAI顶尖AI科学家姚顺宇（Yao Shunyu）以来的首次重大版本发布。目前已进入预览阶段的混元Hy3模型，在复杂推理、代码生成等多个维度上均有显著提升。

作为中国科技巨头之一，腾讯正在加速追赶字节跳动、阿里巴巴和DeepSeek等国内AI竞争对手。当前，中国正大力押注开源AI路线，意图为美国主流大语言模型提供替代选择。早在2023年，腾讯就曾声称当时新推出的混元大语言模型，在能力和智能水平上已超越同期版本的ChatGPT与Llama。

在生态布局方面，腾讯已投资月之暗面（Moonshot AI）、阶跃星辰（StepFun）等AI初创公司，寄望借此带动旗下云计算业务的增长。与此同时，腾讯还对研究团队架构进行了调整，以提升训练数据的质量。据悉，腾讯计划今年将AI投入翻倍，总额超过50亿美元。

另一边，DeepSeek也不甘示弱，正式发布了旗下大语言模型的最新版本——V4 Flash系列与V4 Pro系列。DeepSeek凭借2025年1月推出的R1 AI模型一夜成名，此后持续推进模型迭代。DeepSeek表示，V4系列升级版将在推理能力和智能体任务处理上带来显著进步，同时新引入的混合注意力架构（Hybrid Attention Architecture）功能，将大幅增强AI平台对长对话中历史查询内容的记忆能力。

Q&A

Q1：腾讯混元Hy3模型有哪些主要提升？

A：腾讯混元Hy3模型目前处于预览阶段，相较于此前版本，在复杂推理、代码生成等核心能力上有明显进步。此次更新也是腾讯招募前OpenAI研究科学家姚顺宇后的首次重大发布，标志着腾讯在AI研发投入上进一步提速。

Q2：腾讯在AI领域的投资和布局是怎样的？

A：腾讯已投资月之暗面、阶跃星辰等AI初创公司，希望借此推动云计算业务发展。公司还对研究团队进行了架构调整，以提升训练数据质量，并计划今年将AI投资翻倍，总额超过50亿美元。

Q3：DeepSeek V4系列模型有什么新特性？

A：DeepSeek V4系列分为Flash和Pro两个版本，在推理能力和智能体任务处理上有所提升。其中一项名为混合注意力架构（Hybrid Attention Architecture）的新功能，能够增强AI平台对长对话中历史查询内容的记忆能力，改善用户在长对话场景下的使用体验。

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。