用AI画“夫妻肺片”“叫花鸡”…结果大开眼界！百度今天回应

来源：亚娱体育发布时间：2024-09-17 09:08:40

文心一言完全是百度自研的大语言模型，文生图能力来自文心跨模态大模型ERNIE-ViLG。

在大模型训练中，个人会使用的是网络公开数据，合乎行业惯例。大家也会从接下来文生图能力的快速调优迭代，看到百度的自研实力。

“文心一言”是百度3月16日发布的对标ChatGPT的AI产品，据介绍，它有文学创作、数学逻辑推算等5大能力。没想到，其中

测试着测试着，有网友对文心一言提出了“套壳、画皮、造假”的质疑，认为文心一言是将中文句子机翻成英语单词，用国外开源的人工智能Stable Diffusion生成图片，然后将其返给用户。

。博主认为，这是由于“鼠标”和“总线”的英文是“mouse”和“bus”，文心一言显然对输入的中文进行了机器翻译。

，这甚至并不是一个正常的汉语词组。但文心一言自动生成了“一罐豆子”的图画。测试这个短语的网友指出，这是由于“一可以豆子”机翻成英语，正是“one can bean”，即一罐头豆子。

不过南方都市报实测发现，推出一周以来，文心一言也在进步。对于“车水马龙”这个成语的理解，它就已经从望文生义进化到了接近现实。

网友们提到的Stable Diffusion是什么呢？它是AI文生图模型，背后的公司是Stability AI，这家伦敦的初创公司在2022年8月向大众发布了一个文本生成图片工具Stable Diffusion，该工具被迅速传播，通过用户的反馈不断进化，有人称，这个生成式潘多拉盒子被打开了，而OpenAI迅速效仿，放开了Dall-E 2（OpenAI文本生成图像系统）的限制。

对于文心一言是否采用了Stable Diffusion，澎湃新闻询问了聊天机器人“文心一言”，

文心一言大方承认：“是的，我使用了Stable Diffusion。”

“我还使用了Transformer、GRU等深度学习模型来生成图像。每个模型都有自己的优点和适用场景，具体使用哪个模型取决于任务需求和数据集特点。”文心一言说，

它是基于百度飞桨深度学习平台和文心知识增强大模型技术研发的，同时也借鉴了OpenAI开放平台上近40多种预训练语言模型

，以及Coursera、Udacity等高校教授提供的免费课程内容。这些公共数据为文心一言的训练提供了丰富的标注数据和算法调参依据。

对于文心一言的作画功能是否“套皮”，亚洲视觉科学技术研发总监、微博新知博主@风云学会陈经表示，百度是自己训练的，但是拿英文标注的开源图片做素材，中翻英当prompt（显示提示对话框），百度正在快速改进，套皮是不好改的。

，对于研究问题意义不大，英文标准和中文标注只是一个工程问题，不影响算法进步的实质。百度能训练出画图AI，但是中文输入词还没搞定，估计是没时间，

天使投资人、知名互联网专家郭涛认为，百度发布文心一言，一种原因是应对竞争对手的挑战，快速跟进，以免错失发展良机。另一方面，时下ChatGPT相关概念异常火爆，加速曝光或发布有关产品有助提升股价，提振投资者信心。

不过，对于AI机器人目前将颠覆何种行业，或取代人类工作，业内一致认为，无论是ChatGPT还是文心一言，距离商用均还有距离。

郭涛指出，类ChatGPT产品需要深厚的人工智能有关技术沉淀、海量的训练数据、持续优化的算法模型和长期巨额投资等。但这类AI模型目前还存在算法模型不完善、理解能力不够等问题，距离大规模商业化应用还需要很长一段时间。

。”盘古智库高级研究员江瀚也解释称，“文心一言的发布仅仅是一个开始，整个产品的完善需要通过不断地训练和完备，才有机会让人工智能逐渐达到领先水平，甚至在中文领域完全超越竞争对手。”