HerrFu 个人主页

@weixin_42788769

HerrFu

2023-01-02 20:16:11 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

可狱可囚的爬虫系列课程 17：lxml模块的使用

lxml 是 Python 语言中用于处理 XML 和 HTML 的功能最丰富且易于使用的库。它利用XPath就可以实现对XML和HTML进行数据解析。XML 指可扩展标记语言，XML 是一种很像HTML的标记语言。但是 XML 被设计用来传输和存储数据，HTML 被设计用来显示数据。因为 XML 和 HTML 很像，所以只讲其中一种，另一种大家便可以很简单的融汇贯通。XML长这个样子👇👇👇

#python #爬虫

从零开始学Python系列课程第12课：Python中的分支结构

然而仅有顺序结构并不能解决所有的问题，比如我们设计一个游戏，游戏第一关的通关条件是玩家获得1000分，那么在完成本关卡游戏后，我们要根据得分来判断玩家能否进入下一关，这里就会产生通关和不通关两个分支，而且这两个分支只有一个会被执行。注：如果输入的成绩在90分以上（含90分）输出A；80分-90分（不含90分）输出B；三目运算结构只是单分支结构的变形，程序的性能没有任何变化，只是在某种程度上变得更加

#python #开发语言 #学习

可狱可囚的爬虫系列课程 10：在网站中寻找 API 接口（今日头条热榜爬取）

上一篇文章我们讲述了爬虫中一个比较重要的知识点，如何从 API 接口中获取数据，本篇文章我们继续讲述，如何在网站中寻找 API 接口，我们以“今日头条”网站 https://www.toutiao.com/ 为例。如上图所示，如果要获取页面新闻数据，可能大部分同学的想法就是直接 Requests 结合 BeautifulSoup4 库进行数据的爬取，但是我们不妨先来找找看有没有 API 接口能够让

#python #爬虫

可狱可囚的爬虫系列课程 07：BeautifulSoup4（bs4）库的使用

BeautifulSoup4 属于 BeautifulSoup 系列的第四代版本，BeautifulSoup 是一个可以从 HTML 或 XML 文件中提取数据的 Python 库，这个库能够实现树文档的导航、查找，从而帮助我们提取到网页中所需要的数据。。如果忘记了在哪里安装，请回看 Requests 模块第一篇文章。安装好以后，我们围绕数据提取这个话题对 BeautifulSoup4 进行剖析。

#python #爬虫

到底了