Chrome复制的xpath抓取为空的问题

解决办法：去掉xpath中的tbody即可。原因：浏览器复制的xpath会自动优化，自己加上tbody，其实网页源代码里是没有的。

我曾记得曾经

4079人浏览 · 2018-06-02 13:46:18

我曾记得曾经 · 2018-06-02 13:46:18 发布

解决办法：去掉xpath中的tbody即可。

原因：浏览器复制的xpath会自动优化，自己加上tbody，其实网页源代码里是没有的。

贴个例子

import requests
from lxml import etree
header={'User-Agent': 'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'}
#豆瓣图书排行网站获取图书的名字
url='https://book.douban.com/top250'
r=requests.get(url,headers=header).content
#print(r)#cookies=Cookies
html=etree.HTML(r)
print(html)
#xpath 是从chrome 获得的   最后的@title 自己加的 ，获取图书的标题
#ids=html.xpath('//tr[@class="item"]')
#ids=html.xpath('//tr[@class="item"]/td/div/a/@title')
ids=html.xpath('//*[@id="content"]/div/div[1]/div/table[1]/tr/td[2]/div[1]/a/@title')
print(ids)
'''
for id in ids:
    book_name = id.xpath('td/div/a/@title')
    print(book_name)
'''
#//*[@id="content"]/div/div[1]/div/table[1]/tbody/tr/td[2]/div[1]/a

AtomGit 开源协作平台测评赛

瓜分20万奖金获得内推名额丰厚实物奖励易参与易上手

更多推荐

ADS1292R 使用过程心电图高精度ADC模块

文章目录1 Fundamentals ofPrecision ADC Noise Analysis 精密模数转换器噪声分析基础1 Fundamentals ofPrecision ADC Noise Analysis 精密模数转换器噪声分析基础https://www.ti.com.cn/cn/lit/wp/slyy192/slyy192.pdf?ts=1600659610730&ref_u

开放原子开发者工作坊

实现一个家庭安防与环境监测系统（一）

开放原子开发者工作坊

【cf】Codeforces Round #774 (Div. 2) 前4题

题目A. Square Counting 简单数学题目大意题解代码B. Quality vs Quantity 排序题目大意题解代码C. Factorials and Powers of Two 状态压缩dp+位运算题目大意题解代码D. Weight the Tree 树形dp+dfs题目大意题解代码E. Power Board 看起来像是数论？许多年没打cf了，偶尔打了一盘，恢复紫名了。A. S