对标 ChatGPT，百度正式推出大语言模型“文心一言”

3 月 16 日消息，百度今日下午于北京总部召开新闻发布会。发布会上，百度正式推出大语言模型文心一言，并展示了文心一言在多个使用场景中的综合能力。

从现场展示来看，文心一言某种程度上具有了对人类意图的理解能力。但李彦宏也多次提及，这类大语言模型还远未到发展完善的阶段，进步空间很大。

百度同时公布了文心一言的邀请测试方案。3 月 16 日起，首批用户即可通过邀请测试码，在文心一言官网体验产品，后续将陆续开放给更多用户。此外，百度智能云即将面向企业客户开放文心一言 API 接口调用服务。3 月 16 日起正式开放预约，搜索“百度智能云”进入官网，可申请加入文心一言云服务测试。

发布会现场，百度创始人、董事长兼首席执行官李彦宏展示了文心一言在五个使用场景的表现，包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

在文学创作场景中，文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结，并提出了五个续写《三体》的建议角度，体现出对话问答、总结分析、内容创作生成的综合能力。此外，文心一言准确回答了《三体》作者、电视剧角色扮演者等事实性问题。面对“于和伟和张鲁一有哪些共同点”、“于和伟和张鲁一谁更高”这类问题，文心一言也基于推理能力得出了答案。

在商业文案创作场景中，文心一言顺利完成了给公司起名、写 Slogan、写新闻稿的创作任务。从百度获悉，文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据，以及 5500 亿事实的知识图谱等。

据百度介绍，文心一言还具备了一定的思维能力，能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题，文心一言能理解题意，并有正确的解题思路，进而像学生做题一样，按正确的步骤，一步步算出正确答案。

在此基础上，文心一言还表现出中文理解及多模态生成能力。现场展示中，文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论，还用“洛阳纸贵”四个字创作了一首藏头诗。

多模态生成方面，李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力。值得一提的是，文心一言甚至能够生成四川话等方言语音；文心一言的视频生成能力则因成本较高，现阶段还未对所有用户开放，未来会逐步接入。

数据显示，自 2 月份百度官宣“文心一言”以来，已有超过 650 家企业宣布接入文心一言生态。百度首席技术官王海峰表示，文心一言，是新一代知识增强大语言模型，是在 ERNIE 及 PLATO 系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术，ERNIE 和 PLATO 中也已经有应用和积累，在文心一言中又有了进一步强化和打磨；后三项则是百度已有技术优势的再创新。

对标 ChatGPT，百度正式推出大语言模型“文心一言”

Published by

风君子

发表回复取消回复

Published by

风君子

发表回复 取消回复

发表回复取消回复