logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

在Trae上使用Bright Data MCP采集数据

其实网页爬虫也一样,爬虫说到底就是收集数据,和你平时浏览网页没区别,只不过是用脚本批量化的去采集数据,AI大模型的出现让爬虫也开始进化,传统的Python爬虫、软件爬虫在慢慢被AI爬虫取代,比如说我常用的一个数据采集MCP-Bright Data MCP,能通过Trae这样的Agent调用,直接用自然语言就可以采集目标网站的数据,完全不用写代码,甚至你都不用打开目标网站。Trae是近一年比较流行的

在Trae上使用Bright Data MCP采集数据

其实网页爬虫也一样,爬虫说到底就是收集数据,和你平时浏览网页没区别,只不过是用脚本批量化的去采集数据,AI大模型的出现让爬虫也开始进化,传统的Python爬虫、软件爬虫在慢慢被AI爬虫取代,比如说我常用的一个数据采集MCP-Bright Data MCP,能通过Trae这样的Agent调用,直接用自然语言就可以采集目标网站的数据,完全不用写代码,甚至你都不用打开目标网站。Trae是近一年比较流行的

使用龙虾采集跨境电商数据,零代码实现

刚好有个朋友是做跨境3D打印业务,平时需要分析相关3D打印商品价格趋势,我帮他写个可以用于采集跨境电商商品的skill,部署在openclaw里,能通过钉钉对话输入商品关键词,自动采集对应的商品信息,完全不需要再写任何代码。创建这个skill还需要两个工具,一个是trae或者vscode编辑器,另一个是Anthropic发布的用于创建skill的skill,名字叫作skill-creator,你可

使用龙虾采集跨境电商数据,零代码实现

刚好有个朋友是做跨境3D打印业务,平时需要分析相关3D打印商品价格趋势,我帮他写个可以用于采集跨境电商商品的skill,部署在openclaw里,能通过钉钉对话输入商品关键词,自动采集对应的商品信息,完全不需要再写任何代码。创建这个skill还需要两个工具,一个是trae或者vscode编辑器,另一个是Anthropic发布的用于创建skill的skill,名字叫作skill-creator,你可

你在用哪些 AI Agent(智能体)?

NotebookLM还有个好玩的地方,你可以提问视频的任何时间段内容,它会分层提炼主题,比如“生成3分钟视频的核心摘要,配上时间戳”,它就会把视频按时间片段拆解视频的内容,强到离谱。在NotebookLM的世界里,Youtube视频仿佛是一团面粉,你可以把它做成各种形状、口味的知识糕点,这是对传统视频内容的拆分、整合,图像、文字、声音的边界越来越模糊。不得不感慨,知识获取的方式正在发生着不可逆转的

#人工智能
跨境电商商品采集skill来了,可部署openclaw,不用Python也能搞定爬虫

最近openclaw养龙虾的热潮带动了skill的爆发,github上各种skill层出不穷,可以解决繁杂的办公自动化任务,比如生成ppt、运营媒体账号、审查代码等,skill已经成为ai时代的“万能软件”。刚好有个朋友是做跨境3D打印业务,平时需要分析相关3D打印商品价格趋势,我帮他写个可以用于采集跨境电商商品的skill,部署在openclaw里,能通过钉钉对话输入商品关键词,自动采集对应的商

#python#爬虫#开发语言
AnyGen走的不是NotebookLM的路子

最后我测试了AnyGen的批量调研功能,它可以根据简单的需求,收集数据形成复杂的调研报告,适合学习研究,类似于Gemini的deep reaserch,不过它交付的文件更多,有PDF、word文档、ppt等。总的来说,AnyGen是字节迈向通用Agent的很重要的一步,其显现出的目的也很明确,不再满足对话大模型的限制,要用AI一键搞定日常办公的各种需求,直接交付结果,不需要人来指挥、确认。包括但不

#python
跨境电商商品采集skill来了,可部署openclaw,不用Python也能搞定爬虫

最近openclaw养龙虾的热潮带动了skill的爆发,github上各种skill层出不穷,可以解决繁杂的办公自动化任务,比如生成ppt、运营媒体账号、审查代码等,skill已经成为ai时代的“万能软件”。刚好有个朋友是做跨境3D打印业务,平时需要分析相关3D打印商品价格趋势,我帮他写个可以用于采集跨境电商商品的skill,部署在openclaw里,能通过钉钉对话输入商品关键词,自动采集对应的商

#python#爬虫#开发语言
使用Python和亮数据采集器搭建专利查询GUI系统

最近听某个律师朋友说,虽然现在AI、数字化已经很普遍了,但其实还有很多垂直行业的数据要靠手工拉,比如律师常用的专利信息,需要从各个国家的专利网站去查询,诸如USPTO(美国专利商标局)、谷歌Patent等,然后汇总到Excel中,重复性和碎片化非常严重,这可是上百个国家、上亿条数据呀。最重要的一点是,得确保数据采集的安全性,这些专利数据是公开数据,原则上没问题,但数据采集过程不能干扰到网站的正常运

#python#开发语言
在Trae上使用Bright Data MCP采集数据

其实网页爬虫也一样,爬虫说到底就是收集数据,和你平时浏览网页没区别,只不过是用脚本批量化的去采集数据,AI大模型的出现让爬虫也开始进化,传统的Python爬虫、软件爬虫在慢慢被AI爬虫取代,比如说我常用的一个数据采集MCP-Bright Data MCP,能通过Trae这样的Agent调用,直接用自然语言就可以采集目标网站的数据,完全不用写代码,甚至你都不用打开目标网站。Trae是近一年比较流行的

    共 301 条
  • 1
  • 2
  • 3
  • 31
  • 请选择