logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python爬虫——爬取简历模板

以上就是爬取简历模板的全部过程,程序中只爬取了第一、二、三页,如果想获取更多的模板,可以修改for循环翻页中的数字。在程序中,为了分解每个步骤,把各个部分的代码分开写。可以尝试将各个步骤合并起来,比如,获取到模板详情页的URL之后,对该URL发起请求来获取模板的下载地址,再对下载地址发起请求来将文件保存到本地,需要多嵌套几层循环。该网站中还有其他模板,比如ppt、各种类型的图片等等。如果感兴趣可以

文章图片
#python#爬虫#开发语言
Numpy数据分析02——切片和索引

ndarray对象的内容可以通过索引或切片来访问和修改,与Python中list的切片操作一样。ndarray数组可以基于0-n的下标进行索引注意:区别在于数组切片是原始数组视图(这就意味着,如果做任何修改,原始数组都会跟着更改)。这也意味着,如果不想更改原始数组,我们需要进行显式的复制,从而得到它的副本(.copy())。通过切片和copy复制原列表都是复制赋值,通过直接等于是引用赋值。冒号:的

文章图片
#numpy#数据分析#数据挖掘
Python网页爬虫爬取起点小说——re解析网页数据

1、需要注意响应内容是否与网页源码格式相同2、编写正则表达式时需要将网页源码或者响应内容中的对应元素复制出来,观察其格式,按照格式去编写正则表达式3、如果我们查找不到对应的内容,或者只取到对应内容的一部分,则我们需要扩大查找范围,正则表达式的编写从开始标签的下级标签开始查找。4、建议每次获取到数据都输出查看是否是我们想要的格式和内容。

文章图片
#python#爬虫#开发语言
Python网页爬虫爬取豆瓣Top250电影数据——Xpath数据解析

本次程序只爬取了豆瓣top250电影的展示页面的数据,没有爬取电影详情页的数据。在前面我们已经获取了每一部电影详情页的链接links,如果想要爬取电影的详情页,可以通过for循环遍历列表links,对每一个详情页发起请求,从而获取电影详情页的数据并进行解析。

文章图片
#python#爬虫#开发语言
到底了