首先安装,这里使用docker安装(portia与python版本联系比较紧密建议使用docker安装)

docker pull  starjason/portia

运行

docker run -i -t --rm -v <PROJECTS_FOLDER>:/app/data/projects:rw -p 9001:9001 scrapinghub/portia

还是抓取快代理
https://www.kuaidaili.com/free/inha/
输入网址开始爬虫
在这里插入图片描述
在这里插入图片描述

点击Annotate这里定义抓取规则
在这里插入图片描述
点击即可
在这里插入图片描述
保存后运行看到抓取成功
在这里插入图片描述

退出项目可以下载代码
在这里插入图片描述

最后我个人评价时首先不太灵活,第二现在为止portia的版本都是python2.7的,有点太老了别的,第三如果没用过scrapy用这个图形化界面也未必方便

Logo

权威|前沿|技术|干货|国内首个API全生命周期开发者社区

更多推荐