不知道你发现没,由于现在ChatGPT、DeepSeek、Gemini、豆包等AI大模型的兴起,大家的搜索习惯发生了很大变化,传统的谷歌、百度、必应搜索像是老古董,已经没法满足用户对信息准确性、及时性、高质量的要求了,甚至懒得点开一个个网页去找答案。

其实网页爬虫也一样,爬虫说到底就是收集数据,和你平时浏览网页没区别,只不过是用脚本批量化的去采集数据,AI大模型的出现让爬虫也开始进化,传统的Python爬虫、软件爬虫在慢慢被AI爬虫取代,比如说我常用的一个数据采集MCP-Bright Data MCP,能通过Trae这样的Agent调用,直接用自然语言就可以采集目标网站的数据,完全不用写代码,甚至你都不用打开目标网站。

最近刚好苹果发布新iPhone,我用Bright Data MCP获取最新的iPhone 17价格信息,能实时采集且不需要我处理任何网站限制的问题,我把采集来的信息写成了一个可视化看板,用来实时监测价格信息。

在这里插入图片描述

以上做的事情分为三个步骤,第一是在Trae上配置Bright Data MCP服务,第二是搭建智能体,给到数据采集需求,第三是将反馈的数据开发成可视化看板,咱们会详细讲解每个步骤实现过程。

一、在Trae上配置Bright Data MCP服务

首先要介绍下什么是MCP,它的学名是“模型上下文协议”,你可以理解成它是连接AI大模型和外部工具的一个媒介,类似于电脑和互联网的关系,大模型原先只是封闭的大脑,有了MCP后它就连接了无数的信息、工具、数据,可以做更多的事情,比如Bright Data MCP能实现复杂网站的数据采集。

讲到Bright Data MCP,它是亮数据开发的一款专门用于网络数据采集、搜索的MCP服务,可以最大的特点是可以自动处理各种网站的反爬机制,不需要你考虑什么IP识别、人机检测等技术细节,把爬虫所有能遇到的封禁问题都在后台解决了,你只需要专注于提问聊天就行。

亮数据会送新用户3个月免费额度,每个月5000次MCP请求,完全够用了。

https://get.brightdata.com/wmcp

Bright Data MCP能在Trae、Cluade Code、Cursor等Agent中部署,以Trae为例,主要分为3个步骤。

1、注册亮数据账号,获取MCP API key

你可以直接去亮数据网站注册,注册好后在账户设置-用户管理界面生成专用API key。

https://get.brightdata.com/wmcp


2、获取MCP服务信息

同样在亮数据后台,有个MCP功能区,里面提供了本地和远程两种MCP模式,建议用本地MCP,自己搭建也不复杂,而且相对灵活。

复制上面的MCP配置信息,以及之前申请的Key,留着备用。

这里讲下Bright Data MCP的4个核心组件,分别是search_engine用于搜索引擎抓取​、web_scraper用于处理反爬机制​、search_engine_batch用于批量搜索引擎抓取、​scrape_batch用于批量网页抓取,它们相互配合能采集非常复杂的网页数据。

3、在Trae中配置MCP

Trae是近一年比较流行的AI编辑器,字节开发的产品,类似于VsCode,但Trae有更强的AI编程能力,比如搭建智能体、布置MCP等。

在Trae的AI功能管理中选择手工添加MCP,开始配置信息。

接下来,在配置框里粘贴刚刚在亮数据后台复制的MCP配置信息。

补充一点,配置MCP需要电脑安装Node.js,如果没安装Trae会提醒你安装,直接同意即可。

接下来你就会在MCP界面看到配置好的Bright Data MCP。


MCP服务需要在智能体中使用,接下来我在Trae中创建一个名为“EasySearch”的智能体,并勾选Bright Data MCP服务,还要注意设置初始提示词,告诉智能体它是干什么的,需要在提示语里告诉它用Bright Data MCP。

在这里插入图片描述

到这一步,你就可以用Bright Data MCP来采集数据了。

打开Trae AI对话框,选择刚创建的“EasySearch”智能体,直接问它:

请你梳理美国amazon、苹果官网上iphone17全系列最新价格、配置信息、链接、日期,
以列表形式输出,呈现各平台的对比

该智能体就会自动调用Bright Data MCP服务,去采集网站上iPhone17的价格信息。

最后你会得到结构化的Excel数据,清晰明了。

针对该数据,你还可以让Trae开发一个可视化看板,用于展示。


除了Trae,一些Vscode插件也支持部署Bright Data MCP服务,比如Cline,直接设置远程MCP服务,非常简单。

在亮数据后台复制远程MCP配置信息。

在Cline 远程MCP配置界面粘贴Bright Data MCP配置信息。

提问Cline,它会自动调用Bright Data MCP来采集数据。

总的来说,AI爬虫已经成为不可逆的趋势,完全不需要写代码处理网页,几乎零门槛,而且能很好的和一些智能体结合,做出不错的产品,比如手机的价格监测应用,运营的好也能带来不错的效果。

你可以拿Bright Data MCP练练手,刚好亮数据会送新用户3个月免费额度,每个月5000次MCP请求,足够开发一个小应用了。

https://get.brightdata.com/wmcp

Logo

更多推荐