首先安装,这里使用docker安装(portia与python版本联系比较紧密建议使用docker安装)

docker pull  starjason/portia

运行

docker run -i -t --rm -v <PROJECTS_FOLDER>:/app/data/projects:rw -p 9001:9001 scrapinghub/portia

还是抓取快代理
https://www.kuaidaili.com/free/inha/
输入网址开始爬虫
在这里插入图片描述
在这里插入图片描述

点击Annotate这里定义抓取规则
在这里插入图片描述
点击即可
在这里插入图片描述
保存后运行看到抓取成功
在这里插入图片描述

退出项目可以下载代码
在这里插入图片描述

最后我个人评价时首先不太灵活,第二现在为止portia的版本都是python2.7的,有点太老了别的,第三如果没用过scrapy用这个图形化界面也未必方便

Logo

云原生社区为您提供最前沿的新闻资讯和知识内容

更多推荐