logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Rotten Tomatoes 电影数据分析

“烂番茄”电影数据分析“烂番茄”电影数据分析背景数据采集及处理数据可视化得出结论背景一千个读者眼中有一千个哈姆雷特,看电影也是一种艺术鉴赏活动,不同的观影人有不同的欣赏偏好。所以大众的平均电影评分未必准确,尤其对于品味独特的人,很难在 x x 高分电影列表上找到自己喜欢的。自己深受其苦,喜欢看老电影,但又不想看那些类似于“四大名著”...

pandas 利用 正则表达式 从文本中提取数字

需要从text特征中提取形如 13.5/10 这样的字符串,再分别提取分子分母。1)可以利用 str.extract() 方法。2)利用正则表达式 \d+\.?\d*\/\d+ 进行匹配3)再利用 .split() 方法提取分子分母代码:test.text.tolist()# output['This is Bella. She hopes her smile m...

Data Wrangling

数据整理(Data Wrangling)数据整理(Data Wrangling)可归纳为以下三步:- 数据收集(Gather)- 数据评估(Assess)- 数据清理(Clean)数据收集(Gather)收集数据的方式有很多,最简单、最常见的是下载现成的数据。比如从kaggle上下载数据集。但为了可扩展性(Scalability)和重复性(Reproducibili...

#数据分析
pandas 筛选数据,同时满足多个条件

top10_dire = df_dire.groupby('dire').id.agg('count').sort_values(ascending=False)[:10]## top10_diredireWoody Allen46Clint Eastwood34Martin Scorsese31Steven Spielberg3...

Latex 公式换行 等号左对齐

Latex 公式换行 等号左对齐示例:\begin{equation}\begin{aligned}X^TXh - X^TY&=\begin{bmatrix}x_1 & x_2 & ... & x_n\\1 & 1 & ... & 1\end{bmatrix}\begin{bmatrix

conda导出环境和pip导出环境

导出项目用到的包:先安装pipreqspip install pipreqs进入到项目目录下,导出包pipreqs --force检查当前目录,发现已经重新生成了requirements.txt文件,其中只有项目用到包requests==2.21.0etornado==0.1.3导出当前环境用到的包:pip freeze > requirements.txt...

pandas删除含有空值的行

df.dropna(axis=0, how='any', inplace=True)axis:0-行操作(默认),1-列操作how:any-只要有空值就删除(默认),all-全部为空值才删除inplace:False-返回新的数据集(默认),True-在愿数据集上操作...

tableau学习资源

Tableau官方推荐项目集Tableau官方培训视频Tableau官方在线指南Udemy的Tableau相关课程Coursera的Tableau专项课程Coursera的Tableau单项课程数据可视化博客VizWiz...

dockerfile build时报错

报错:有 Dockerfile 文件如下:(该文件可在vs code中使用插件生成,非常方便)# For more information, please refer to https://aka.ms/vscode-docker-pythonFROM python:3.8-slim-busterEXPOSE 5000# Keeps Python from generating .pyc file

mac系统 使用vscode连接远程服务器

本机运行 ssh-keygen 生成公钥将公钥 “~/.ssh/id_rsa.pub” 内容复制到远程主机 ~/.ssh/authorized_keys 文件末尾本机.ssh/config 文件末尾增加如下设置:vscode 下载插件 Remote-SSH,点击左下角绿色按钮,cmd palatte中选择"connect to host":选择远程主机,输入对应的登录密码,连接成功。...

到底了