logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据分析实例——美国加州人口分析[isnull().any()/.unique()/merge/set_index/df.query/sort_values]

一、准备好数据集二、需求分析案例分析:美国各州人口数据分析作业知识补充首先导入文件,并查看数据样本合并pop与abbrevs两个DataFrame,分别依据state/region列和abbreviation列来合并。为了保留所有信息,使用外合并。查看存在缺失数据的列。使用.isnull().any(),只有某一列存在一个缺失数据,就会显示True。查看缺失...

Python压缩文件夹

def zipDir(dirpath='v1.0', outFullName='v1.0.zip'):"""压缩指定文件夹:param dirpath: 目标文件夹路径:param outFullName: 压缩文件保存路径+xxxx.zip:return: 无"""with zipfile.ZipFile(outFullName, "w", zipfile.ZIP_DEFLATED) as zf

#python
jieba分词自定义词典

    从语料库down下来的词频表,结合业务实际分词进行调优,添加云计算(jieba无法准确划分该词)等词及词频,down的文件格式使用python的文件读写进行调整:with open(file='./Minedic.txt',mode='r',encoding='utf-8') as f:read=f.readlines()for line in read:st...

#自然语言处理
朴素贝叶斯分类算法[sklearn.naive_bayes/GaussianNB/MultinomialNB/BernoulliNB]

朴素贝叶斯举栗子1'''另一个例子,现分别有 A、B 两个容器,在容器 A 里分别有 7 个红球和 3 个白球,在容器 B 里有 1 个红球和 9 个白球,现已知从这两个容器里任意抽出了一个球,且是红球,问这个红球是来自容器 A 的概率是多少?假设已经抽出红球为事件 B,选中容器 A 为事件 A,则有:P(B) = 8/20,P(A) = 1/2,P(B|A) = 7/10,...

jupyter notebook读取/导出文件/图片

import numpy as npimport matplotlib.pyplot as pltimport pandas as pdfrom pandas import Series,DataFrame# 如果不添加该行,则每次显示图片都需要加上plt.show%matplotlib inline读入文件:pd.read_csv('./test.csv')读入图片:plt....

【转】机器学习-Python自然语言处理库

自然语言处理的库非常多,下面列举一些对Python友好,简单易用,轻量,功能又全的库。1 中文中文自然语言处理工具评测:https://github.com/mylovelybaby/chinese-nlp-toolkit-testawesome: https://github.com/crownpku/Awesome-Chinese-NLPHanlp地址:https://git...

Git出现|MERGING解决

输入命令可以正常跳转:git reset --hard head再进行merge如何push即可:He-NingQiu@LAPTOP-HTU50PHP MINGW64 /f/MyItem_git/OurTeam_git/Match (hnq)$ git merge hnqAlready up to date.He-NingQiu@LAPTOP-HTU50PHP MINGW64...

到底了