概要

最近在上课时总是出现网络不稳定导致的PPT无法浏览的情况出现,就想到下载到电脑上。但是PPT是一个HTML的网页,无法通过保存网页(右键另存为mhtml只能保存当前页)的形式全部下载下来,试了其它的一些浏览器插件如 Save All Resource 和猫抓,也不能满足需求。通过对比,最终选择了影刀RPA软件+自定义脚本的方式来下载PPT内容。

实现细节

  1. 下载影刀RPA软件,一个可以让所有手动操作变为通过脚本驱动的全自动过程的软件。

  2. 安装RPA浏览器插件,如下图在这里插入图片描述

  3. 编写脚本,脚本教程在影刀官网有视频教学。这里主要用到了“网页自动化”中的捕捉元素,点击元素,监听网页请求,获取网页监听结果,HTTP下载。示例如下:
    在这里插入图片描述

  4. 由于PPT是需要不断点击下一页才能刷新出新的内容,所以需要捕捉下一页按钮,和灰灰化的下一页按钮(用来判定结束),然后再通过网页监听就可以获取到所有的网页内资源如html, css, js, png等

  5. 通过HTTP模块下载所有的资源文件
    在这里插入图片描述

小结

通过使用RPA软件+脚本方式下载资源文件,大大节省了时间和精力。影刀RPA还有很多其它强大的功能,相信在未来这款应用能够创造更多的奇迹,帮助到更多的人。

Logo

欢迎加入西安开发者社区!我们致力于为西安地区的开发者提供学习、合作和成长的机会。参与我们的活动,与专家分享最新技术趋势,解决挑战,探索创新。加入我们,共同打造技术社区!

更多推荐