高代学困生. 个人主页

@qq_68922336

高代学困生.

2024-01-09 18:41:59 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Python 爬虫 · XML、xpath 与 lxml 模块基础

本文介绍了XML文档的结构和XPath语言的基本用法，以及如何在Python中使用lxml模块解析XML/HTML文档。主要内容包括：1) XML文档的组成（声明、节点、内容、属性等）；2) XPath语法，包括绝对/相对路径、通配符、属性调用和逻辑运算；3) 使用lxml模块的etree.XML()解析XML文档，通过xpath()方法查询节点内容、属性和文本。文章通过图书馆书籍数据的XML示例

#python #开发语言 #爬虫

Python 爬虫 · PyQuery 模块基础

本文介绍了Python中的PyQuery模块，这是一个类似jQuery的HTML解析库，支持CSS选择器操作。主要内容包括：1）PyQuery的安装方法；2）基本使用流程，包括初始化对象、标签选择（标签选择器、ID选择器、类选择器等）；3）常用函数如attr()获取属性、text()获取文本；4）增删改操作（after()、append()、remove()等）；5）使用规律总结。PyQuery适

#爬虫 #python

Python 爬虫 · 模拟浏览器登陆 - 处理 Cookie

本文介绍了Python爬虫如何通过模拟浏览器登录来获取需要身份验证的网站数据。主要内容包括：1. 解释Cookie的作用机制，说明其弥补HTTP无状态缺陷的功能；2. 使用requests模块的session()函数保持会话，通过post方法发送登录信息（用户名/密码）；3. 详细演示如何通过浏览器开发者工具获取标准URL、登录参数和Cookie；4. 提供直接传入Cookie和User-Agen

#python #爬虫 #开发语言

Python 爬虫 · 第三方代理接入与合规使用

本文介绍代理相关知识和简单操作流程，结合requests模块应用，请各位合法合规使用爬虫，非必要不使用代理。

#python #爬虫 #开发语言

Python 练习题讲解 3 · 字符串

本文分为两部分：1.选择题部分总结了11个Python字符串常用方法（如len()、index()等）和操作符（如*、+、转义字符）的功能说明；2.编程题提供了一个根据输入数字判断季节的Python代码示例，通过if-elif-else结构实现3-5月为春季，6-8月为夏季，9-11月为秋季，12-2月为冬季的判断，并包含非法输入处理。全文简要介绍了字符串基础操作和条件判断编程实例。（150字）

#python #开发语言

Python 练习题讲解 4 · 列表

本文总结了Python列表(List)的基本特性和常用操作，包括元素增删改、索引、排序方法等。同时介绍了集合转换、随机函数以及牛顿法求解方程等编程技巧。编程题部分包含列表求和、数组运算、奇数筛选等实例，展示了循环、条件判断和列表生成式的应用。文章还涉及输入处理、数据类型转换和数值计算等内容，为Python初学者提供了实用的编程参考。

#python #开发语言

Python 练习题讲解 6 · 使用容器计算

本文介绍了Python的组合数据类型（序列、集合、映射）及其基本操作。选择题部分通过字典查询、集合去重排序、字符串遍历等示例演示了数据类型的使用方法。编程题实现了一个用户登录系统，通过验证用户名密码匹配性，包含错误提示和尝试次数限制功能。文中代码示例展示了字典键值查询、集合去重排序、字符串遍历输出控制等典型应用场景，以及while循环和条件判断的实际运用。

#python

Python 爬虫 · 正则表达式与 re 模块基础

本文总结了Python正则表达式(regex)的基础知识及应用。正则表达式通过元字符(如\w, \d)和量词(*, +, {n})组合实现高效文本匹配，支持贪婪/惰性匹配模式。重点介绍了re模块的8个核心函数：match()从开头匹配、search()全局搜索、findall()返回所有匹配、sub()替换文本等。每个函数配有代码示例说明用法，如re.compile()预编译提升效率，subn()

#爬虫 #正则表达式 #python

Python 爬虫 · HTML 与 CSS 基础

本文介绍了HTML和CSS的基础知识。HTML是网页的核心标记语言，通过标签组织内容，包含<html>、<head>、<body>等基本结构标签，以及文本、列表、表格等常用元素标签。CSS用于控制网页样式，介绍了11种选择器（通用、标签、类、ID等）及其优先级规则，以及多种伪类和伪元素选择器的使用方法，帮助实现精准的样式控制。这些知识为网页爬取时识别和提取特定内

#python #爬虫 #开发语言 +2

Python 爬虫 · bs4 模块基础

本文介绍了使用Python的BeautifulSoup4(bs4)库解析HTML/XML文档的方法。主要内容包括：1) bs4模块简介及安装方法；2) 基本使用方法：从模块导入、创建解析对象到常用查找方法；3) 详细演示了find()和find_all()方法，包括按标签名、属性筛选等操作，并展示了获取元素文本和属性的示例代码。该教程适合初学者学习网页数据抓取技术。

#python #爬虫 #开发语言

共 18 条

请选择