百度回应文心一言文生图质疑：能力来自跨模态大模型，数据使用符合行业惯例

澎湃新闻记者吴雨欣

2023-03-23 11:13

来源：澎湃新闻

百度回应外界对文心一言生图功能的质疑。

3月23日，百度方面向澎湃新闻记者表示，文心一言完全是百度自研的大语言模型，文生图能力来自文心跨模态大模型ERNIE-ViLG，“在大模型训练中，我们使用的是互联网公开数据，符合行业惯例。大家也会从接下来文生图能力的快速调优迭代，看到百度的自研实力。”

百度表示：“文心一言正在大家的使用过程中不断学习和成长，请大家给自研技术和产品一点信心和时间，不传谣信谣，也希望文心一言能够给大家带来更多欢乐。”

据悉，近日有网友通过对文心一言的测试，对文心一言提出质疑。有博主在微博发文称，百度的人工智能，是将中文句子机翻成英语单词，用国外开源的人工智能Stable Diffusion生成图片，然后将其返给用户。

从该博主的测试来看，让文心一言画鼠标和总线，其会画出“老鼠和公共汽车”，因为鼠标和总线的英文单词分别是mouse和bus；让其画起重机，文心一言会画出一只鹤的头，因为起重机的英文是crane，这个单词也有鹤的意思。

3月23日，澎湃记者让文心一言画“起重机”，文心一言输出一幅带有鹤的图画

什么是Stable Diffusion？它是AI文生图模型，背后的公司是Stability AI，这家伦敦的初创公司在2022年8月向大众发布了一个文本生成图片工具Stable Diffusion，该工具被迅速传播，通过用户的反馈不断进化，有人称，这个生成式潘多拉盒子被打开了，而OpenAI迅速效仿，放开了Dall-E 2（OpenAI文本生成图像系统）的限制。

对于文心一言的作画功能是否“套皮”，亚洲视觉科技研发总监、微博新知博主@风云学会陈经表示，百度是自己训练的，但是拿英文标注的开源图片做素材，中翻英当prompt（显示提示对话框），百度正在快速改进，套皮是不好改的。

该人士指出，现在全球AI研发有开源传统，特别是训练数据库，不然大家自己收集图片效率太低，“也有中文标准的训练数据，但是很少，对于研究问题意义不大，英文标准和中文标注只是一个工程问题，不影响算法进步的实质。百度能训练出画图AI，但是中文输入词还没搞定，估计是没时间，因为发布会时间已经定了，所以弄个简单的中翻英来应对。”

一位不愿具名的AI人士也向澎湃新闻记者表示：“百度不至于套壳，大概率是用了公开素材用于模型训练，为求快把英文直接机器翻译成中文，遇到成语就翻车，比如，车水马龙拆成车/水/马/龙，此前百度推出的文心一格是单纯的文生图，不大会出现这个问题，而文心一言是对话+图片生成，问题就出来了。”

从百度目前发布的信息来看，其还将在下周一举行新品发布会，发布系列文心一言云服务和应用产品，百度称，不同类型的企业可以依据自己需求，选取相应的云服务和产品，方便、快捷、低成本地构建自己的模型和应用。

百度CEO李彦宏表示：“文心一言是否会颠覆百度搜索，这离我们的真实想法差得真是太远太远了。我从来不觉得商业模式会是个问题，总有办法解决。我真正兴奋的是，对百度来说，更大的故事在云计算。文心一言带来的优势，让百度智能云有可能成为市场第一。”

责任编辑：是冬冬

图片编辑：金洁