腾讯混元大模型升级:中文能力超GPT-3.5,微信搜一搜等接入

澎湃新闻记者 范佳来
2023-10-27 13:54
来源:澎湃新闻

“今年以来,腾讯训练大模型的效率不断提升,已经开发了7b和13b的中小模型,成本有明显降低,大(模型)有大的做法,小(模型)有小的做法。”

10月26日,腾讯机器学习平台算法负责人康战辉在接受澎湃新闻等媒体采访时,谈到了腾讯混元大模型的最新进展。

当天,腾讯混元大模型迎来升级,正式开放“文生图”功能,升级后的腾讯混元中文能力整体超过GPT-3.5,代码能力提升20%。

目前,超过180个腾讯内部业务已接入腾讯混元,包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。腾讯混元大模型也已经面向C端用户陆续开放体验,用户通过小程序或网页端,就能与腾讯混元对话。

此前9月7日,腾讯正式发布混元大模型,并通过腾讯云对外开放,当时仅有50余个内部业务接入混元大模型,在一个多月内,接入业务数量已翻三倍以上。腾讯集团副总裁蒋杰曾向澎湃新闻记者坦言,“混元大模型在腾讯内部已经内测很久,在推出时间上,没有考虑过和同行进行赛跑。”

在混元升级后,谈到大模型的研发成本,康战辉透露,目前腾讯研发大模型有两个方向,在能力方面,希望对于通用大模型能够以效果为主,也是长期投入;在小型模型上,希望能更加精细化,将不同的模型应用到不同场景上,同时也更加考虑投入和产出的性价比。通俗来说,就是“大模大做,小模小做”

谈到腾讯旗下核心产品微信和QQ何时接入混元时,康战辉表示,混元在公司内部是底座的定位,所有应用都会基于混元大模型做智能化研发,微信场景下的搜一搜也已经接入混元,“至于腾讯其他的产品和应用要给大家提供什么能力和服务,以及什么时间发布,取决于业务的实际情况。”

此外,对于混元大模型未来是否会开源的问题,康战辉表示,目前混元大模型还未实现彻底开源,需要首先在内部打磨才能赋能于合适的场景,目前还没有对外开源的计划。

值得注意的是,当天腾讯混元大模型还发布了“文生图”的新功能。在技术特点上,文生图技术负责人芦清林告诉澎湃新闻记者,在语义理解方面,混元采用中英文双语细粒度的模型,同时建模中英文实现双语理解生成图片。

在内容合理性方面,混元文生图通过增强算法模型的图像二维空间位置感知能力,将人体骨架和人手结构等先验信息引入到生成过程中,让生成的图像结构更合理,减少错误率。

在画面质感方面,混元文生图基于多模型融合的方法,提升生成质感。经过模型算法的优化之后,混元文生图的人像模型,包含发丝、皱纹等细节的效果提升30%,场景模型,包含草木、波纹等细节的效果提升25%。

    责任编辑:孙扶
    图片编辑:张同泽
    校对:张艳