百度文心一言4.0抢先体验教程！

本文重点介绍了文心一言4.0的抢先体验方式。并且基于推理能力、中文理解能力，结合不同的案例对比了文心一言、ChatGPT、Claude2的生成能力，非常有趣。很高兴可以见证国内大模型的崛起，就像我最近经常说的一样，国内大模型在很多维度虽然看似落后国外一大截，但是潜力无限，国人的学习能力一点也不担心，只是时间问题而已。未来国内大量的核心业务能否走上快车道，全看这些国内大模型怎么发展，我相信不久的一天

Jay....

17233人浏览 · 2023-10-25 13:47:19

Jay.... · 2023-10-25 13:47:19 发布

🍁 展望：关注我, AI学习之旅上，我与您一同成长！

一、引言

想快速体验文心一言4.0，但又觉得技术难度太高？别担心，我来手把手教你！ 🚀

10月17日，文心一言4.0震撼亮相，带着一系列闪亮的AI原生应用与服务。这包括了 百度新搜索、百度地图、百度新文库、百度网盘、百度新如流、百度输入法，甚至还有国内首创的生成式商业智能产品——百度GBI。

令人瞩目的是，百度宣布文心大模型4.0在理解、生成、逻辑及记忆四大领域都有了突破性进展，与GPT4的综合表现不相上下！

作为一个ChatGPT的忠实用户，我对此感到无比兴奋，并迫不及待想亲自试试。初次公开的只是API版本，对于不熟悉技术的朋友们来说，可能显得有些遥不可及。

但现在，文心一言4.0已全面开放！对于想快速上手体验的你，我写了一篇通俗易懂的教程，希望能助你一臂之力。

二、创建应用

登陆，进入链接 https://console.bce.baidu.com/qianfan/ais/console/applicationConsole/application

填写应用名称、应用描述，再点击确认。

三、在线测试

进入链接：https://console.bce.baidu.com/qianfan/ais/console/onlineTest

一）参数设置

选择服务：必填，ERNIE-Bot 4.0
选择应用：必填，<上一步创建的应用>
温度：可默认，较高的数值会使输出更加随机，而较低的数值会使其更加集中和确定。
多样性：可默认，影响输出文本的多样性，取值越大，生成文本的多样性越强。
重复惩罚：可默认，用通过对已生成的token增加惩罚，减少重复生成的现象。说明：值越大表示惩罚越大。
系统人设：可为空，设定角色。

二）Prompt模版

1、预置模版

文心一言提供了很多预置模版。可以方便用户快速使用。

1）切换到 Prompt模版。

2）点击 预置模版。

3）选择自己需要的模版进行对话。

2、自制模版

自定义一些个人使用的常规模版，方便后期直接引用。

1）点击 Prompt模版。

2）选择 自制模版。

3）点击 创建模版。

4）自动跳入该页面后，点击 创建模版。

5）输入模版的相关信息。

变量，可以再引用模版时进行输入，从而完善提示词内容。

6）创建成功。

7）引用模版。

8）使用效果。

四、实测结果对比

相对于目前4.0关于多模态的功能更新，我反而更加关心文心一言4.0的推理能力和中文理解能力，话不多说，我们来测试一下。

一）推理能力

文心大模型4.0说是重点升级了数学计算能力，那我们来看看下面两个案例的效果：

1、案例一

之前测试过一个问题，把4杯25度的水倒在一起是多少度, 我们看下不同模型之间的回答。

文心一言 2.4.0:

文心一言 4.0：

GTP-4：

Claude2：

针对这个问题，文心一言4.0的推理能力很不错了，相比于之前2.4.0是聪明不少了，并且相比于 GPT-4 和 Claude2，推理过程更加清晰。

2、案例二

我们再测试一个案例。在公园的长椅上坐了三人，他们之间有两个兄长，两个弟弟，这是怎么回事?

文心一言 2.4.0:

文心一言 4.0：

GPT-4:

Claude2:

文心一言2.4.0的答案是错的，文心一言4.0的推理结果也是比较清晰符，GPT-4像是在做算术题，答案的确是对的，就是看着有点费脑。

二）中文理解能力

理解能力，尤其是中文理解能力，一直是国外大模型的弱点。对于这次文心一言4.0的发布，我最大的期待其实就是中文理解能力，能拥有懂中文的大模型那是一件多么幸福的事情！

1、案例一

小偷偷偷偷东西，这句话是什么意思?

文心一言2.4.0:

文心一言4.0：

GPT-4：

Claude2:

4个模型的输出结果不分伯仲，都可以比较好的解释这句话的意思。但是，文心一言4.0可以识别出这句话是个口语，并不是规范表达，这是文心一言4.0的亮点。

2、案例二

文心一言2.4.0:

文心一言4.0：

GPT-4:

Claude2:

由于这个梗的事件发生在 2023年9月，而GPT-4的模型数据截止为 2022年1月，所以这里直接使用ChatGPT的联网模式来测试。整体测试下来，文心一言无论 2.4.0 还是 4.0 表现的都很出色，GPT-4 联网后解释的也很全面，但是 Claude2 就没那么幸运了！

3、案例三

再来个更好玩的谐音笑话。 大家好，我是一只螃蟹我的钳子没了我没钳了。

文心一言2.4.0:

文心一言4.0：

GPT-4：

Claude2:

文心一言、GPT-4，针对这个谐音笑话理解的都很到位，但是Claude2很不稳定，在 Claude2上多次测试下来，经常 get 不到谐音的正确解释。

五、总结

本文重点介绍了文心一言4.0的抢先体验方式。并且基于推理能力、中文理解能力，结合不同的案例对比了文心一言、ChatGPT、Claude2的生成能力，非常有趣。

很高兴可以见证国内大模型的崛起，就像我最近经常说的一样，国内大模型在很多维度虽然看似落后国外一大截，但是潜力无限，国人的学习能力一点也不担心，只是时间问题而已。未来国内大量的核心业务能否走上快车道，全看这些国内大模型怎么发展，我相信不久的一天，我们可以追上国外的水平！

最后，关注我，AI学习之旅上，我与您一同成长！

AI大模型技术社区

分享最新、最前沿的AI大模型技术，吸纳国内前几批AI大模型开发者

更多推荐

GEO优化选型手册与核心技术解析

AI大模型技术社区

2026智慧农业实战：Java+YOLOv11农作物病虫害检测，边缘部署零Python，每亩增产20%

AI大模型技术社区

从AI到抗量子：下一代金融基础设施正在发生什么变化？

相比AI的快速落地,量子计算仍处于发展早期,但其潜在影响更为深远。人工智能在金融领域的应用,已经从辅助工具,逐步进入“决策参与”。在高频、自动化、跨境的环境下,一旦错误被快速放大,代价极高。在这样的背景下,可以更清晰地理解 DrixPay 的意义。在这一过程中,类似 DrixPay + FUSN 的组合,传统金融依赖“人”的判断,而AI引入的是“概率决策”。下一轮竞争,已经不再只是“谁更快”,而是