logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

python 爬虫-爬取学堂在线合作院校

关键词:动态页面 JavaScript接口 绕过网页直接爬取信息亲测有效,转自https://blog.csdn.net/weixin_43873801/article/details/109689852

#python#爬虫
数据预处理:标称型特征的编码和缺失值处理

标称型特征编码(Encoding categorical feature)有些情况下,某些特征的取值不是连续的数值,而是离散的标称变量(categorical)。比如一个人的特征描述可能是下面的或几种:features ['male', 'female'], ['from Europe', 'from US', 'from Asia'], ['use Firefox', 'use Chorme',

#数据库#python#数据分析
盘点那些没用的上网小技巧-主流直播平台直播源的获取(适用potplayer)

主流平台直播直播源的获取一、任务简介二、分析网页三、写直播源文件.dpl一、任务简介看到网上很多小伙伴都很喜欢或者希望自己的potplayer能够直接播放直播源,不用打开网页只用自己的播放器就可坐看直播,确实很不错。但是问题是,网上虽然有不少资源,但大都是电视频道,并不都是自己想看的直播。主流的直播平台,哔哩哔哩、斗鱼、虎牙等等,还有一些专用平台,例如各个游戏的比赛直播等等,这些直播源怎样获取?二

完全小白篇-使用Python爬取网络小说

完全小白篇-使用Python爬取网络小说找一个你要爬取的小说分析网页一、网页的展示方式需要用到的库文件向网站发送请求正则提取跳转的逻辑后续处理保存信息进入docx文件新的问题:超时重传找一个你要爬取的小说作为python小白,这篇博客仅作为我的一个学习记录。本篇我就拿一个实际案例来做吧,短短50行代码调试了一晚上,爬虫还得继续好好学啊!拿最近很火的《元龙》举例。(采用读书网的资源)分析网页一、网页

#python
到底了