
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
最近分析了一个儿童视力数据,记录一下。有需要数据的小伙伴可以去下载。import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport reimport osimport seaborn as snsimport scipy.stats as ssplt.rcParams['font.family'] = ['Sim
获取之后,就能访问该车型,一般一个车型有好多款式,我的目的是向比较一些车型的尺寸,所以一个车型就选第一种款式,访问进入该车型第一种款式的参数配置,这样把参数下载下来,放到一个文件里,就可以比较现在卖的车的尺寸情况。我自己写的dcd爬虫,这个网站比较简单。看了看别人的程序,觉得用起来挺别扭,就自己捣鼓了一天。第二部分,我尝试了一下动态请求车型的价格。最后,下载了一些json文件。这个网站没有反爬,有

接着上面的。使用xpath提取信息,虽然python很多库,比如beautifulsoup,也有很多功能,比如查找节点,添加删除节点。但是个人感觉对爬虫来说,最重要的还是提取信息,当然,顺利的提取信息的前提是你得掌握好这些库的用法,不过有些功能确实一辈子也不会用到。对爬虫来说,就是提取文本,获取属性,这两个。还是打开页面,这里我直接读入本地的文件,知识为了简单起见。不在requests了。我们自己
记录一下自己的爬虫踩过的坑,上一次倒是写了一些,但是写得不够清楚,这次,写清楚爬取的过程。这个网站是某省的志愿服务网。就是它了。我向爬取一些组织开展过的活动,比如这一个组织,这个组织的页面找打它不存在什么问题,组织的网址只需要拼接就可以了。看似很容易。基础网址是:https://sd.zhiyuanyun.com/app/org/view.php?id=(*****)前面是一堆,后面只需要把id后
实验室电脑只有原装的python本来打开excel很简单的事情。padnas直接读。结果报错。试了好几遍。都不行。这里记录一下。需要安装 两个,openpyxlxlrdpip install openpyxlpip install xlrd安装完之后,在读,如果还出错。那么 改成csv, 读csv 时。df = pd.read_csv("content.csv", engine='python')
python中列表元素虽然有下标,但是有时候需要特定的用途,查找指定的特殊值的元素的下标。这时候可以用for循环,打印出来下标,但是每次都要写for循环,感觉还是有点麻烦。比如这样使用enumerate,枚举列表中的元素,a = [1, 2, 8, None, 'test']for i in range(len(a)):if a[i] == None:print(i)for i in range(