1. 安装python
    网上有很多安装教程,大家自行百度。
  2. 下载驱动
    首先,要确定你的浏览器的版本,根据浏览器及对应的版本,去下载对应版本的驱动。我的是谷歌浏览器,所以我下载的是谷歌驱动。
    查看浏览器版本:
    在这里插入图片描述
    下载驱动:http://npm.taobao.org/mirrors/chromedriver/
    在这里插入图片描述
    下载驱动后,将驱动放到python的安装目录:
    在这里插入图片描述
  3. 安装selenium
    安装selenium有两种方法,一个是通过pip命令安装:
pip install selenium

还有一种方法是通过pycharm安装:
在这里插入图片描述
在弹出的available packages窗口中,搜索selenium并进行安装:
在这里插入图片描述
需要注意,python默认的源地址是官方网站,速度很慢,大家可以更换镜像源之后再进行安装,这样速度会更快,具体可参考:
更改pip镜像源。
更改pycharm镜像源。
至此,selenium webdriver的环境已经搭建完成。

现在,我们新创建一个py文件,进行一个简单的使用。下面使用的是谷歌驱动进行:
首先导入selenium:

from selenium import webdriver

创建对象(通过这样启动浏览器,是一个非常干净的环境,不用顾虑缓存等):

chrome_driver = webdriver.Chrome()

我们把鼠标放置在Chrome()上,点击ctrl+b查看创建对象时的初始化方法:
在这里插入图片描述
通过初始化方法,我们可以看到几个参数:
executable_path、port、options、service_args、desired_capabilities、service_log_path、chrome_options、keep_alive。
executable_path:执行路径,这个路径是从环境变量中找的,一般我们将驱动放到python的安装目录后,会自动找到这个路径,所以一般我们在创建浏览器变量时,是不传这个参数的。
port:运行浏览器时要使用的端口,默认值为0,为0时,会随机选择一个未使用的端口进行使用,一般我们也不会去传这个参数。
options:
service_args:服务参数,即启动浏览器时的一些参数。具体由哪些参数,可以打开cmd名称界面,执行chromedriver --help查看。
在这里插入图片描述
desired_capabilities:暂时没理解什么作用。
service_log_path:log地址。默认值None,即不保存log日志。在传参时,可以传入一个路径,进行保存日志。
chrome_options:启动谷歌浏览器时的一些参数。具体可以参考chrome options参数使用
keep_alive:我们通常在tcp中看到,保持长连接。

使用对象,我们可以看到,可以调用很多对外接口,我们通过这些接口,对浏览器进行操作:
在这里插入图片描述
比如打开一个百度地址,可以调用get方法:

chrome_driver.get("http://www.baidu.com")

运行后,就会自动打开浏览器,并打开百度地址:
在这里插入图片描述

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐