python爬虫：scrapy可视化管理工具spiderkeeper部署

需要安装的库比较多，可以按照步骤，参看上图理解环境准备scrapy: https://github.com/scrapy/scrapyscrapyd: https://github.com/scrapy/scrapydscrapyd-client: https://github.com/scrapy/scrapyd-clientSpiderKeeper: https:/...

文章共720字 · 阅读需要大约3分钟

一键AI生成摘要，助你高效阅读

问答

彭世瑜

6603人浏览 · 2018-05-22 17:22:37

彭世瑜 · 2018-05-22 17:22:37 发布

这里写图片描述

需要安装的库比较多，可以按照步骤，参看上图理解

环境准备

scrapy: https://github.com/scrapy/scrapy
scrapyd: https://github.com/scrapy/scrapyd
scrapyd-client: https://github.com/scrapy/scrapyd-client
SpiderKeeper: https://github.com/DormyMo/SpiderKeeper

安装

pip install scrapy scrapyd scrapyd-client spiderkeeper

部署项目

第一步，启动scrapyd

$ scrapyd

测试地址：http://localhost:6800/

关于scrapyd的部署安装参考：scrapy部署之scrapyd

第二步，启动SpiderKeeper

借用 SpiderKeeper 的 github 的指导（我翻译的）：
命令行启动

$ spiderkeeper

选项：

spiderkeeper [options]

Options:

  -h, --help            展示帮助信息并且退出
  --host=HOST           host, 默认:0.0.0.0
  --port=PORT           port, 默认:5000
  --username=USERNAME   设置用户名 ,默认: admin
  --password=PASSWORD   设置密码 ,默认: admin
  --type=SERVER_TYPE    接受蜘蛛服务器类型, 默认: scrapyd
  --server=SERVERS      爬虫服务器, 默认: ['http://localhost:6800']
  --database-url=DATABASE_URL
                        SpiderKeeper 数据库，默认: sqlite:home/souche/SpiderKeeper.db
  --no-auth             不进行验证
  -v, --verbose         日志级别