模拟登录豆瓣(python爬虫)
模拟登录豆瓣使用selenium和time两个库,不考虑需要验证码的情况。步骤如下:1.首先进入豆瓣首页2.模拟点击密码登录3.模拟输入账号密码4.模拟点击登录5.进入页面,运行结果为True。代表登录成功,账号信息在网页源代码中!代码如下:其中使用css类选择器寻找元素(密码登录,账号输入框,密码输入框,登录豆瓣)from selenium import webdriverimport time
·
模拟登录豆瓣
使用selenium和time两个库,不考虑需要验证码的情况。
步骤如下:
1.首先进入豆瓣首页
2.模拟点击密码登录
3.模拟输入账号密码
4.模拟点击登录
5.进入页面,运行结果为True。代表登录成功,账号信息在网页源代码中!
代码如下:
其中使用css类选择器寻找元素(密码登录,账号输入框,密码输入框,登录豆瓣)
from selenium import webdriver
import time
# 缺少验证码的情况
url = "https://www.douban.com"
web = webdriver.Chrome()
web.implicitly_wait(3) # 隐式等待3秒
web.get(url) # 链接到豆瓣首页
iframe = web.find_element_by_tag_name('iframe') # 主代码在iframe里面,要先切进去
web.switch_to.frame(iframe) # 切到内层
web.find_element_by_css_selector('.account-tab-account').click() # 模拟鼠标点击
web.find_element_by_css_selector('#username').send_keys('你自己的账号') # 模拟键盘输入
web.find_element_by_css_selector('#password').send_keys('你自己的密码')
web.find_element_by_css_selector('.btn-account').click()
time.sleep(3) # 要先等待,再获取源代码,否则获取的网页源代码是豆瓣首页
html = web.page_source # 获取源代码
print("加辣椒了吗?" in html) # 你自己的账号名称,如果结果为True,则登录成功!(记得改成自己账号哦!)
web.quit() # 关闭浏览器
如图,豆瓣的登录代码块是在iframe标签里面的,所以我们要先切到iframe里面!这一步很重要!!!
iframe = web.find_element_by_tag_name(‘iframe’)
就这样,是不是很简单呢!解释一万句,不及代码20行!
更多推荐
已为社区贡献1条内容
所有评论(0)