logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

记录一次数据分析的过程。儿童视力数据(1)

最近分析了一个儿童视力数据,记录一下。有需要数据的小伙伴可以去下载。import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport reimport osimport seaborn as snsimport scipy.stats as ssplt.rcParams['font.family'] = ['Sim

#数据分析#数据挖掘#python
我的dcd爬虫-Python

获取之后,就能访问该车型,一般一个车型有好多款式,我的目的是向比较一些车型的尺寸,所以一个车型就选第一种款式,访问进入该车型第一种款式的参数配置,这样把参数下载下来,放到一个文件里,就可以比较现在卖的车的尺寸情况。我自己写的dcd爬虫,这个网站比较简单。看了看别人的程序,觉得用起来挺别扭,就自己捣鼓了一天。第二部分,我尝试了一下动态请求车型的价格。最后,下载了一些json文件。这个网站没有反爬,有

文章图片
#爬虫#python#开发语言
python爬虫,爬取猫眼电影2(xpath和bs4)

接着上面的。使用xpath提取信息,虽然python很多库,比如beautifulsoup,也有很多功能,比如查找节点,添加删除节点。但是个人感觉对爬虫来说,最重要的还是提取信息,当然,顺利的提取信息的前提是你得掌握好这些库的用法,不过有些功能确实一辈子也不会用到。对爬虫来说,就是提取文本,获取属性,这两个。还是打开页面,这里我直接读入本地的文件,知识为了简单起见。不在requests了。我们自己

#python#爬虫
爬虫 python 爬取php的网页,带有post参数的网页如何爬取

记录一下自己的爬虫踩过的坑,上一次倒是写了一些,但是写得不够清楚,这次,写清楚爬取的过程。这个网站是某省的志愿服务网。就是它了。我向爬取一些组织开展过的活动,比如这一个组织,这个组织的页面找打它不存在什么问题,组织的网址只需要拼接就可以了。看似很容易。基础网址是:https://sd.zhiyuanyun.com/app/org/view.php?id=(*****)前面是一堆,后面只需要把id后

#python
记录一下实验室打开excel文件的尴尬。

实验室电脑只有原装的python本来打开excel很简单的事情。padnas直接读。结果报错。试了好几遍。都不行。这里记录一下。需要安装 两个,openpyxlxlrdpip install openpyxlpip install xlrd安装完之后,在读,如果还出错。那么 改成csv, 读csv 时。df = pd.read_csv("content.csv", engine='python')

#python
python获取列表中指定元素的下标

python中列表元素虽然有下标,但是有时候需要特定的用途,查找指定的特殊值的元素的下标。这时候可以用for循环,打印出来下标,但是每次都要写for循环,感觉还是有点麻烦。比如这样使用enumerate,枚举列表中的元素,a = [1, 2, 8, None, 'test']for i in range(len(a)):if a[i] == None:print(i)for i in range(

#python
到底了