在Python自动化领域,Selenium和Requests是两个常用工具,但各有局限。DrissionPage巧妙结合了两者优势,既能用浏览器自动化处理动态页面,又能通过HTTP请求提升效率。本文将带你从零开始,用10分钟掌握DrissionPage的核心用法。
一、DrissionPage是什么?
DrissionPage是一个混合驱动的网页自动化库,核心特点:
- 双引擎驱动:支持Selenium(浏览器渲染)和Requests(HTTP请求)无缝切换
- 简洁API:类似jQuery的选择器语法,操作更直观
- 智能等待:自动处理元素加载延迟
- 多浏览器支持:Chrome/Firefox/Edge等
适合场景:
- 网页数据采集
- 自动化测试
- 表单填写
- 文件上传/下载
- 任何需要模拟用户操作的场景
二、快速安装
|
1 |
pip install DrissionPage
|
如果使用Selenium模式,需额外下载对应浏览器的WebDriver(如chromedriver)
三、5分钟上手基础操作
1. 初始化浏览器会话
|
1
2
3
4
5
6
7 |
from DrissionPage import ChromiumPage # 以Chrome为例
# 启动浏览器(无头模式可加headless=True)
page = ChromiumPage()
# 访问网页
page.get('https://www.baidu.com')
|
2. 元素定位与操作
|
1
2
3
4
5
6
7 |
# 通过ID定位搜索框并输入内容
search_box = page.ele('#kw') # CSS选择器语法
search_box.input('Python自动化')
# 通过文本定位按钮并点击
search_btn = page.ele('text:百度一下')
search_btn.click()
|
3. 获取页面数据
|
1
2
3
4
5
6
7
8
9 |
# 获取标题
print(page.title)
# 获取当前URL
print(page.url)
# 获取元素文本(如第一条搜索结果)
first_result = page.eles('div.result')[0].text
print(first_result)
|
4. 完整示例:百度搜索
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17 |
from DrissionPage import ChromiumPage
# 初始化
page = ChromiumPage()
page.get('https://www.baidu.com')
# 操作
page.ele('#kw').input('DrissionPage')
page.ele('text:百度一下').click()
# 获取结果
results = page.eles('div.result c-container')
for i, result in enumerate(results[:3], 1):
print(f"{i}. {result.text.split('\n')[0]}")
# 关闭浏览器
page.close()
|
四、进阶功能速览
1. 智能等待机制
|
1
2
3
4
5 |
# 等待元素出现(最多10秒)
element = page.wait('@div.loading', timeout=10) # @表示CSS选择器
# 等待页面标题包含特定文本
page.wait('title:结果页面')
|
2. 切换窗口/iframe
|
1
2
3
4
5 |
# 切换到新标签页
page.switch_to.new_tab('https://example.com')
# 切换到iframe
page.switch_to.frame('iframe_id') # 或通过索引page.switch_to.frame(0)
|
3. 文件上传
|
1
2
3 |
# 直接操作隐藏的file input
upload_input = page.ele('input[type="file"]')
upload_input.send_keys(r'C:\test\file.jpg')
|
4. 执行JavaScript
|
1
2
3
4
5
6 |
# 获取页面JS变量
window_width = page.run_js('return window.innerWidth')
print(f"窗口宽度: {window_width}")
# 修改页面样式
page.run_js('document.body.style.backgroundColor = "lightblue"')
|
五、常见问题解决
1. 元素找不到?
- 检查选择器是否正确(推荐使用浏览器开发者工具复制CSS选择器)
- 添加显式等待:
page.wait('@selector', timeout=10)
- 确认元素是否在iframe中
2. 如何处理登录弹窗?
|
1
2
3 |
# 示例:处理基本认证弹窗
page.set_auth('username', 'password')
page.get('https://example.com/protected')
|
复制讲解
3. 如何截图保存?
|
1 |
page.save('screenshot.png') # 保存当前页面截图
|
4. 无头模式设置
|
1
2 |
# 启动时添加参数
page = ChromiumPage(headless=True) # 无界面模式
|
所有评论(0)