
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在平时使用Cookie,我最喜欢直接复制开发者工具中的请求头Cookie的那一段值,因为这样最方便了,但是,好像Selenium不支持通过请求头的方式指定Cookie,至少我没有找到,如果哪位大佬知道,欢迎在评论区分享。现在,只要你之前在浏览器登录过了,那在Selenium中打开的网页也会处于登录状态(除非登录过期了),但这种加载用户文件夹的方式也有个缺点,那就是启动Selenium之前,要先把C
在爬取某个网站的时候遇到加密参数,由于js代码经过混淆编译不好破解,所以采用selenium的方式获取参数,但是我们获取selenium的数据基本上都是基于页面的,对于网站发起的异步请求,我们可以从日志中提取。显式等待的方式等待某个元素出现,你也可以隐式等待或者直接sleep,如果你不等待,异步请求还没加载完就开始获取,你可能会拿不到想要的数据。的日志,即发送异步请求的数据,因为我需要该请求的请求
Word可以把文档分成不同的部分方便管理,即不同的节,在python-docx把节用Section对象表示,Document对象有add_section()方法添加节,可以通过sections属性获取所以节。值得注意的是,Document对象没有默认的段落,但有一个默认的节如果插入节不指定节的类型,默认是WD_SECTION_START.NEW_PAGE,即新页节,另外还有连续分节符、奇数页、偶数
1.pyautoguipyautogui是用来做GUI桌面应用自动化的Python包,功能类似于按键精灵,可以实现控制鼠标、键盘、消息框、截图、定位功能,支持跨平台。不过也有缺点,比如说不支持中文输入(一般配合pyperclip解决此问题)2.安装# Windowspip install pyautogui -i https://pypi.tuna.tsinghua.edu.cn/simple#
如果你需要在局域网分享文件,可以使用QQ微信等办公软件挺方便的,但是如果是大文件,比如说好几G的,先不说速度慢,由于限制,还不一定能发给别人但如果你的电脑上安装了python(没有的话也可以自己安装一个,占用资源很小),我们可以使用它自带的http模块运行一个http服务,这样局域网内的设备都能通过浏览器去访问和下载文件了由于走的是局域网路线,所以传输速度基本上取决于你的路由器或交换机的速度。
我们可以使用asyncio创建协程,把同步任务变成异步任务很简单,我们在定义函数的时候在前面加上async修饰,在耗时任务那行代码使用await修饰,这时候调用函数,它就会返回一个协程(coroutine)对象,然后调用asyncio.run()把协程对象丢进去就能执行了。在调用执行的时候,需要创建一个事件循环,在事件循环里执行任务,这样它会在耗时的时候自动切换到其他任务。假设有一个任务test(
浏览器会发送请求,服务器也会响应请求,这个过程是可以被playwright介入的,类似于开发框架里的中间件(钩子),比如说我们可以在发送请求前修改请求体活请求头,或者我们不让请求图片以提升速度。
1.迭代器迭代器是一个可以迭代的对象,我们可以通过next()不断取出下一个值,直到抛出StopIteration异常。迭代器的计算是惰性的,只有在需要返回下一个数据时它才会计算。可迭代对象(Iterable)却不一定是迭代器对象(Iterator),这是两个不同的对象,是因为它们实现的方法不一样,后面有说2.迭代方式2.1 判断是否可以迭代from collections.abc import
1.安装Javamkdir /data/{softs,server} -pcd /data/softs然后复制Java安装包到当前文件夹tar -xf jdk-8u121-linux-x64.tar.gz -C /data/servercd /data/server/ln -s jdk1.8.0_121/ java配置环境变量# vi /etc/profile.d/java.sh# java en
1.lxmllxml是一个高效率的HTML或XML文档解析库,用C语言写的,所以解析速度很快,我们可以配合xpath语法使用1.1 xpath语法【爬虫】元素定位(xpath、css)1.2 常见的解析库解析器使用方法优点缺点Python标准库BeautifulSoup(markup, “html.parser”)Python的内置标准库执行速度适中文档容错能力强版本容错能力差lxml HTML