NoSuchElementException: Message: no such element: Unable to locate element

最初的源代码import refrom selenium import webdriverimport timebrowser = webdriver.Chrome()url = 'http://www.sse.com.cn//disclosure/credibility/supervision/inquiries/'browser.get(url)time.sleep(3) #这里必须加3秒的延

Triumph19

2265人浏览 · 2022-03-29 15:03:32

Triumph19 · 2022-03-29 15:03:32 发布

最初的源代码

import re
from selenium import webdriver
import time

browser = webdriver.Chrome()
url = 'http://www.sse.com.cn//disclosure/credibility/supervision/inquiries/'
browser.get(url)
time.sleep(3) #这里必须加3秒的延迟，因为需要等待网页加载完毕
data = browser.page_source
#print(data)

import pandas as pd
table_all = pd.DataFrame()
for i in range(10): #爬取前10页的表格
    browser.find_element_by_xpath('//*[@id="ht_codeinput"]').send_keys(i + 1)
    browser.find_element_by_xpath('//*[@id="pagebutton"]').click()
    time.sleep(3) #这里必须加3秒的延迟，因为需要等待网页加载完毕
    data = browser.page_source

    p_href = '<td><a href="(.*?)" target="_blank">.*?</a></td>' #获取每个文件的链接
    href = re.findall(p_href,data)

    table = pd.read_html(data)[0] #获取表格数据
    table['网址'] = href #拼接网址列
    table_all = table_all.append(table) #拼接表格


table_all

报错如下

添加标题的xpath表达式，解决该问题

新增20和22行代码

import re
from selenium import webdriver
import time

browser = webdriver.Chrome()
url = 'http://www.sse.com.cn//disclosure/credibility/supervision/inquiries/'
browser.get(url)
time.sleep(3) #这里必须加3秒的延迟，因为需要等待网页加载完毕
data = browser.page_source
#print(data)

import pandas as pd
table_all = pd.DataFrame()
for i in range(10): #爬取前10页的表格
    browser.find_element_by_xpath('//*[@id="ht_codeinput"]').send_keys(i + 1)
    browser.find_element_by_xpath('//*[@id="pagebutton"]').click()
    time.sleep(3) #这里必须加3秒的延迟，因为需要等待网页加载完毕
    data = browser.page_source

    p_title = '<td><a href=".*?" target="_blank">(.*?)</a></td>'
    p_href = '<td><a href="(.*?)" target="_blank">.*?</a></td>' #获取每个文件的链接
    title = re.findall(p_title,data)
    href = re.findall(p_href,data)

    table = pd.read_html(data)[0] #获取表格数据
    table['网址'] = href #拼接网址列
    table_all = table_all.append(table) #拼接表格


table_all

在这里插入图片描述

AtomGit 开源协作平台测评赛

瓜分20万奖金获得内推名额丰厚实物奖励易参与易上手

更多推荐

ADS1292R 使用过程心电图高精度ADC模块

文章目录1 Fundamentals ofPrecision ADC Noise Analysis 精密模数转换器噪声分析基础1 Fundamentals ofPrecision ADC Noise Analysis 精密模数转换器噪声分析基础https://www.ti.com.cn/cn/lit/wp/slyy192/slyy192.pdf?ts=1600659610730&ref_u

开放原子开发者工作坊

实现一个家庭安防与环境监测系统（一）

开放原子开发者工作坊

【cf】Codeforces Round #774 (Div. 2) 前4题

题目A. Square Counting 简单数学题目大意题解代码B. Quality vs Quantity 排序题目大意题解代码C. Factorials and Powers of Two 状态压缩dp+位运算题目大意题解代码D. Weight the Tree 树形dp+dfs题目大意题解代码E. Power Board 看起来像是数论？许多年没打cf了，偶尔打了一盘，恢复紫名了。A. S