Beautiful Soup 库

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库,最主要的功能是从网页抓取数据。

一、安装

目前最常用的版本是Beautiful Soup 4,也就是 bs4 ,所以在导入时 import bs4就是在导入Beautiful Soup 4。

本次的详细教程是以windows操作系统为例,结尾有其他系统的简单教程

安装该库有两种方法,一种是在命令窗口通过 pip 直接安装,另一种是下载安装包来进行安装。

1.通过 pip 安装
  • 在windows任务栏的搜索框输入cmd打开命令窗口(右键管理员方式打开
  • 输入命令pip install beautifulsoup4,回车,等待安装完成即可。
    如下图所示:在这里插入图片描述
2. 下载安装包安装
  • 官方下载地址:https://www.crummy.com/software/BeautifulSoup/bs4/download/

    点击链接,如上图。这里有 BeautifulSoup 4 所有版本的安装包,根据需要选择下载,这里推荐目前最新版 4.9 。在这里插入图片描述
    点击红色框链接下载。
  • 下载完成后解压安装包,在windows任务栏的搜索框输入Windows PowerShell,以管理员身份进入。
    在这里插入图片描述
    输入cd d:\python\beautifulsoup4-4.9.0命令,即安装包文件的位置,这里演示的是我自己的路径。具体输入你安装的实际位置。
    在这里插入图片描述
    回车之后输入python setup.py install
    再回车就会自动安装。
二、验证

上述方式安装完成之后,在你的python执行终端,或者是编辑器里输入

from bs4 import BeautifulSoup 	#注意大小写

在这里插入图片描述
如果编辑器没有报错,说明安装成功。

:不管是 pip安装,还是安装包下载,都需要联网。

三、其它系统安装方式(Linux 和 Mac)
1. Linux 系统基本安装方法

在系统的命令窗口输入

$sudo apt-get install python-bs4
2. Mac 系统基本安装方法

在系统的命令窗口输入

$sudo easy_install pip

安装 Python 的包管理器 pip,然后运行

$pip install beautifulsoup4

来安装库文件。

另外,注意如果你的设备同时安装了 Python 2.x 和 Python 3.x,你需要用 python3 运行
Python 3.x:

$python3 myScript.py

当你安装包的时候,如果有可能安装到了 Python 2.x 而不是 Python 3.x 里,就需要使用:

$sudo python3 setup.py install

如果用 pip 安装,你还可以用 pip3 安装 Python 3.x 版本的包:

$pip3 install beautifulsoup4

注: Linux和mac操作系统的安装方式我没有亲测过,这里参考自一本经典畅销的爬虫学习书,如有顾虑,请谨慎。

相关链接

Beautiful Soup 官网:
https://www.crummy.com/software/BeautifulSoup/
Beautiful Soup 英文教程:
https://www.crummy.com/software/BeautifulSoup/bs4/doc/#
Beautiful Soup 中文教程:
http://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐