
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
解决爬虫中lxml.etree.XMLSyntaxError问题
在使用lxml中的etree.parse()方法解析HTML页面源码的时候,可能会报错:lxml.etree.XMLSyntaxError。出现这个问题的主要原因是:html代码书写不规范,不符合xml解析器的使用规范。解决方法修改代码如下:parser = etree.HTMLParser(encoding="utf-8")tree = etree.parse('XX.html', parser
到底了







