在10月17日的百度世界2023上,文心大模型4.0版本正式发布!百度直接放话:文心大模型4.0是目前最强大的文心大模型。会上百度董事长李彦宏为我们展示了文心大模型4.0在搜索、地图、商业智能、智能会议、智能视频、多轮对话方面的强悍。那文心大模型4.0真有这么好?我们在第一时间拿到测试资格,并进行了实际实测。

在这里插入图片描述

相比文心大模型3.5刚出来的时候,文心大模型4.0现在已经进化出了更多功能,光是插件就有8个,包括一镜流影(文字转视频)、说图解画(看图说话)、E言易图(可视化数据分析)等。

这些插件还可以自由组合,来完成更复杂的任务。

在这里插入图片描述

今天我们先从更基础的角度出发,中文理解能力、视频生成能力、中文方言能力等3个方面,来给大家介绍下文心大模型4.0以及插件一镜流影,在视频方面的能力。

理解能力,尤其是中文理解能力

先来看看文心大模型4.0的理解能力。这里主要考考它应对**“语言陷阱”的能力,以及技术专用语的“识别力”**。文心大模型4.0的回答很简洁,直接给出答案。

在这里插入图片描述

回答的Docker是计算机里的一个开源的应用容器引擎以及它的作用。

生成能力,尤其是生成视频的能力

那么接下来这波,我们测试一下文心一言4.0生成视频的能力,看看这种神奇的能力,它是否具备。这时候我们就得看看文心一言的插件了,一镜流影(文字转视频),也就是文心一言4.0生成视频的能力。

在这里插入图片描述

“一镜流影”是文心一言4.0里的插件,通过一种技术手段,将文字内容自动转换为视频形式,使得文字能够以更生动、形象的方式呈现出来。这种技术可以应用于各种文本内容,如新闻报道、小说、诗歌等,将其转化为具有视觉效果的动态影像,为观众带来更加丰富和直观的观看体验。一镜流影技术可以大大提高内容的表现力和吸引力,有助于更好地传达文本中所包含的信息和情感。

我们接下来尝试下,使用一镜流影(文字转视频)功能去生成视频。使用文心一言4.0的一镜流影,文案:什么是docker,生成一段30秒的视频详解。

在这里插入图片描述

我们看一下一镜流影插件生成视频,不仅仅是生成一段docker容器的剪辑,没想到连文案和字幕语音都配好了,完成度很高。看到这里不得不感慨技术的进步,视频剪辑已经不是专业运营人员的专用了,我们使用文心一言4.0插件一镜流影,也能快速产出输出一个高质量的宣传视频了。

普通话版docker讲解

方言能力

然后,是方言能力测试。文心大模型4.0说是重点升级了数学计算能力,我们就直接上方言测试,看它是否能支持各种方言:

以下是一个使用四川话播报的介绍Docker的视频脚本: [背景音乐起,轻松明快] 旁白(四川话):Docker是个啥?Docker就是一种开源的应用容器引擎,让我们可以打包应用和依赖包到一个可移植的镜像中,发布到任何流行的Linux或Windows操作系统上。 [镜头切换,展示Docker图标和官网] 旁白(四川话):Docker可以帮助我们更快地交付应用,将应用程序和基础设施层隔离,像管理程序一样管理基础设施。 [镜头切换,展示Docker容器运行的示例] 旁白(四川话):使用Docker,我们可以更快地打包、测试和部署应用程序,缩短从编写到部署运行代码的周期。 [镜头切换,展示Docker在开发流程中的应用] 旁白(四川话):总之,Docker就是一种让我们轻松搞定应用部署和管理的神器!

四川话版docker讲解

粤语版docker讲解

总结

测到这里,不妨做个小小的总结:整体来看,中文理解能力、视频生成能力、中文方言能力都很强悍。首先能够根据我们的对话,生成视频脚本;其次能够通过插件把视频脚本转成视频;最后还可以任意改变语言,能支持中文里的方言。

从3月份文心一言发布,到年中文心大模型3.5版本更新,再到现在4.0惊艳亮相,百度文心大模型的迭代速度不可谓不迅速。这一次的评测,在视频生成方面的惊艳表现,确实非常惊人,是对传统的视频剪辑的颠覆。再一次体现了百度在大模型领域深厚的技术积累。

展望AI原生的新时代,文心一言大模型基础能力的快速进步,以及AI原生应用开发的颠覆式操作和表现,都令人感慨,未来是科技的时代,也是智能的时代。

Logo

分享最新、最前沿的AI大模型技术,吸纳国内前几批AI大模型开发者

更多推荐