logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python 爬虫 · XML、xpath 与 lxml 模块基础

本文介绍了XML文档的结构和XPath语言的基本用法,以及如何在Python中使用lxml模块解析XML/HTML文档。主要内容包括:1) XML文档的组成(声明、节点、内容、属性等);2) XPath语法,包括绝对/相对路径、通配符、属性调用和逻辑运算;3) 使用lxml模块的etree.XML()解析XML文档,通过xpath()方法查询节点内容、属性和文本。文章通过图书馆书籍数据的XML示例

#python#开发语言#爬虫
Python 爬虫 · PyQuery 模块基础

本文介绍了Python中的PyQuery模块,这是一个类似jQuery的HTML解析库,支持CSS选择器操作。主要内容包括:1)PyQuery的安装方法;2)基本使用流程,包括初始化对象、标签选择(标签选择器、ID选择器、类选择器等);3)常用函数如attr()获取属性、text()获取文本;4)增删改操作(after()、append()、remove()等);5)使用规律总结。PyQuery适

#爬虫#python
Python 爬虫 · 模拟浏览器登陆 - 处理 Cookie

本文介绍了Python爬虫如何通过模拟浏览器登录来获取需要身份验证的网站数据。主要内容包括:1. 解释Cookie的作用机制,说明其弥补HTTP无状态缺陷的功能;2. 使用requests模块的session()函数保持会话,通过post方法发送登录信息(用户名/密码);3. 详细演示如何通过浏览器开发者工具获取标准URL、登录参数和Cookie;4. 提供直接传入Cookie和User-Agen

#python#爬虫#开发语言
Python 爬虫 · 第三方代理接入与合规使用

本文介绍代理相关知识和简单操作流程,结合requests模块应用,请各位合法合规使用爬虫,非必要不使用代理。

#python#爬虫#开发语言
Python 练习题讲解 3 · 字符串

本文分为两部分:1.选择题部分总结了11个Python字符串常用方法(如len()、index()等)和操作符(如*、+、转义字符)的功能说明;2.编程题提供了一个根据输入数字判断季节的Python代码示例,通过if-elif-else结构实现3-5月为春季,6-8月为夏季,9-11月为秋季,12-2月为冬季的判断,并包含非法输入处理。全文简要介绍了字符串基础操作和条件判断编程实例。(150字)

#python#开发语言
Python 练习题讲解 4 · 列表

本文总结了Python列表(List)的基本特性和常用操作,包括元素增删改、索引、排序方法等。同时介绍了集合转换、随机函数以及牛顿法求解方程等编程技巧。编程题部分包含列表求和、数组运算、奇数筛选等实例,展示了循环、条件判断和列表生成式的应用。文章还涉及输入处理、数据类型转换和数值计算等内容,为Python初学者提供了实用的编程参考。

#python#开发语言
Python 练习题讲解 6 · 使用容器计算

本文介绍了Python的组合数据类型(序列、集合、映射)及其基本操作。选择题部分通过字典查询、集合去重排序、字符串遍历等示例演示了数据类型的使用方法。编程题实现了一个用户登录系统,通过验证用户名密码匹配性,包含错误提示和尝试次数限制功能。文中代码示例展示了字典键值查询、集合去重排序、字符串遍历输出控制等典型应用场景,以及while循环和条件判断的实际运用。

#python
Python 爬虫 · 正则表达式与 re 模块基础

本文总结了Python正则表达式(regex)的基础知识及应用。正则表达式通过元字符(如\w, \d)和量词(*, +, {n})组合实现高效文本匹配,支持贪婪/惰性匹配模式。重点介绍了re模块的8个核心函数:match()从开头匹配、search()全局搜索、findall()返回所有匹配、sub()替换文本等。每个函数配有代码示例说明用法,如re.compile()预编译提升效率,subn()

#爬虫#正则表达式#python
Python 爬虫 · HTML 与 CSS 基础

本文介绍了HTML和CSS的基础知识。HTML是网页的核心标记语言,通过标签组织内容,包含<html>、<head>、<body>等基本结构标签,以及文本、列表、表格等常用元素标签。CSS用于控制网页样式,介绍了11种选择器(通用、标签、类、ID等)及其优先级规则,以及多种伪类和伪元素选择器的使用方法,帮助实现精准的样式控制。这些知识为网页爬取时识别和提取特定内

#python#爬虫#开发语言 +2
Python 爬虫 · bs4 模块基础

本文介绍了使用Python的BeautifulSoup4(bs4)库解析HTML/XML文档的方法。主要内容包括:1) bs4模块简介及安装方法;2) 基本使用方法:从模块导入、创建解析对象到常用查找方法;3) 详细演示了find()和find_all()方法,包括按标签名、属性筛选等操作,并展示了获取元素文本和属性的示例代码。该教程适合初学者学习网页数据抓取技术。

#python#爬虫#开发语言
    共 18 条
  • 1
  • 2
  • 请选择