logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

爬取拉勾网招聘信息(selenium+lxml)

再次爬取拉勾网招聘信息作学习交流对于上一种爬虫方式,很容易受到网站反爬机制的识别,每一次失效都需要去花时间修改代码,所以可以使用selenium模拟浏览器行为去获取数据,只要拉勾网不把selenium ban掉,理论上就可以一直使用。需要注意的是,代码在模拟浏览器点击下一页的过程中,需要对driver的当前窗口进行切换。附代码:#encoding: utf-8from selenium ...

#python#selenium#html
到底了