logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

使用selenium获取百度搜索内容

from selenium import webdriverimport csvimport threadingimport timefrom lxml import etreefrom queue import Queueclass BaiduSpider(object):def __init__(self):self.url = 'https://w...

#百度#selenium#ajax
使用代理请求拉勾网接口

前面试过使用selenium爬取拉勾网,但是效率特别慢,今天试了一下请求数据传输接口,不需要多线程速度就特别快了。主要实现原理,写个伪代码:while True:1.实例化session随机添加代理UA和IP2.建立与拉钩网的持续会话3.post请求数据传输API相当于每次重新请求接口之前,重新实例化一个session。提交的form data 里面提交的数据,pn就是页...

#python#json
到底了