LAN_KINGDOM 个人主页

@qq_39000057

LAN_KINGDOM

2024-08-06 13:01:46 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Scrapy-fake-useragent

pip install scrapy-fake-useragentDOWNLOADER_MIDDLEWARES = {'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware': None,'scrapy.downloadermiddlewares.retry.RetryMiddleware': None,'scrapy_fake_us

#scrapy

selenium爬取京东数据（Chrome）

这里就用xpath提取数据就行，但要注意一点就是京东页面跳转有时候会出现数据加载失败，导致数据无法更新，此时要分别定位最上面和最下面的两个重试按钮并点击。每一页的数据可能会爬得不是很全，会少那么几个。那是因为是网站的问题，会有几个商品的数据一直会加载不出来。标题和评论我用了函数式写法，string(.)是获取该标签写的所有内容，因为有些内容不在同一个标签里。原理就是执行JavaScript模拟鼠标

#selenium #测试工具

Scrapy-fake-useragent

#scrapy

到底了