腾讯混元大模型升级：中文能力超GPT-3.5，微信搜一搜等接入

澎湃新闻记者范佳来

2023-10-27 13:54

来源：澎湃新闻

“今年以来，腾讯训练大模型的效率不断提升，已经开发了7b和13b的中小模型，成本有明显降低，大（模型）有大的做法，小（模型）有小的做法。”

10月26日，腾讯机器学习平台算法负责人康战辉在接受澎湃新闻等媒体采访时，谈到了腾讯混元大模型的最新进展。

当天，腾讯混元大模型迎来升级，正式开放“文生图”功能，升级后的腾讯混元中文能力整体超过GPT-3.5，代码能力提升20%。

目前，超过180个腾讯内部业务已接入腾讯混元，包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。腾讯混元大模型也已经面向C端用户陆续开放体验，用户通过小程序或网页端，就能与腾讯混元对话。

此前9月7日，腾讯正式发布混元大模型，并通过腾讯云对外开放，当时仅有50余个内部业务接入混元大模型，在一个多月内，接入业务数量已翻三倍以上。腾讯集团副总裁蒋杰曾向澎湃新闻记者坦言，“混元大模型在腾讯内部已经内测很久，在推出时间上，没有考虑过和同行进行赛跑。”

在混元升级后，谈到大模型的研发成本，康战辉透露，目前腾讯研发大模型有两个方向，在能力方面，希望对于通用大模型能够以效果为主，也是长期投入；在小型模型上，希望能更加精细化，将不同的模型应用到不同场景上，同时也更加考虑投入和产出的性价比。通俗来说，就是“大模大做，小模小做”。

谈到腾讯旗下核心产品微信和QQ何时接入混元时，康战辉表示，混元在公司内部是底座的定位，所有应用都会基于混元大模型做智能化研发，微信场景下的搜一搜也已经接入混元，“至于腾讯其他的产品和应用要给大家提供什么能力和服务，以及什么时间发布，取决于业务的实际情况。”

此外，对于混元大模型未来是否会开源的问题，康战辉表示，目前混元大模型还未实现彻底开源，需要首先在内部打磨才能赋能于合适的场景，目前还没有对外开源的计划。

值得注意的是，当天腾讯混元大模型还发布了“文生图”的新功能。在技术特点上，文生图技术负责人芦清林告诉澎湃新闻记者，在语义理解方面，混元采用中英文双语细粒度的模型，同时建模中英文实现双语理解生成图片。

在内容合理性方面，混元文生图通过增强算法模型的图像二维空间位置感知能力，将人体骨架和人手结构等先验信息引入到生成过程中，让生成的图像结构更合理，减少错误率。

在画面质感方面，混元文生图基于多模型融合的方法，提升生成质感。经过模型算法的优化之后，混元文生图的人像模型，包含发丝、皱纹等细节的效果提升30%，场景模型，包含草木、波纹等细节的效果提升25%。

责任编辑：孙扶

图片编辑：张同泽

校对：张艳