logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

解决爬虫中lxml.etree.XMLSyntaxError问题

在使用lxml中的etree.parse()方法解析HTML页面源码的时候,可能会报错:lxml.etree.XMLSyntaxError。出现这个问题的主要原因是:html代码书写不规范,不符合xml解析器的使用规范。解决方法修改代码如下:parser = etree.HTMLParser(encoding="utf-8")tree = etree.parse('XX.html', parser

#爬虫
到底了