
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
一个人能做出什么开源项目?
高性能分布式 RPA,一个人高强度连续写了几年,感觉大脑每个细胞都激活了,根本停不下来。目前该项目仍然由我独自维护升级。可以操纵大规模浏览器集群,尤其适用于网络爬虫的各种场景:从 a, b, c 到大规模采集最复杂的站点,完整精确提取网页数据,支持使用 SQL 提取网页内容,从而降低管理复杂任务、复杂页面内容提取规则的难度。同时,我也独立开发了基于视觉模型和机器学习的自动网页数据提取算法。

如何快速读懂开源代码?
只有当你着手修改一个开源项目,你才能够快速懂得它。

PulsarRPA 教程 16 - 顶尖项目实战
Exotic Amazon 是采集整个 TOP 1 网站的完整解决方案,开箱即用,包含亚马逊大多数数据类型,它将永久免费提供并开放源代码。其他电商平台数据采集,其方法和流程基本类似,可以在该项目基础上修改调整业务逻辑即可,其基础设施解决了所有大规模数据采集面临的难题。

一个人能做出什么开源项目?
高性能分布式 RPA,一个人高强度连续写了几年,感觉大脑每个细胞都激活了,根本停不下来。目前该项目仍然由我独自维护升级。可以操纵大规模浏览器集群,尤其适用于网络爬虫的各种场景:从 a, b, c 到大规模采集最复杂的站点,完整精确提取网页数据,支持使用 SQL 提取网页内容,从而降低管理复杂任务、复杂页面内容提取规则的难度。同时,我也独立开发了基于视觉模型和机器学习的自动网页数据提取算法。

大规模网站数据采集的完整开源解决方案
在大规模数据采集场景下,往往面临诸多困难。现在,我们可以使用或者参考学习开放源代码的成熟解决方案 PulsarRPA。

到底了







