logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

项目1:pandas数据分析之商铺数据清洗

作业要求:1、成功读取“商铺数据.csv”文件2、解析数据,存成列表字典格式:[{‘var1’:value1,‘var2’:value2,‘var3’:values,…},…,{}]3、数据清洗:① comment,price两个字段清洗成数字② 清除字段缺失的数据③ commentlist拆分成三个字段,并且清洗成数字数据源格式如下:importpandas as pdimportnumpy a

#数据分析#pandas
文本分析-中文停用词集合(结合百度停用词表、哈工大停用词表、四川大学机器智能实验室停用词库、中文停用词表等)

整理去重,百度停用词表、哈工大停用词表、四川大学机器智能实验室停用词库、中文停用词表等

文章图片
#python#nlp#数据分析
Tableau直方图,条形图

作业要求:1、导入“豆瓣电影数据.xlsx”文件;2、绘制各国家电影数量条形图(按此命名工作表),要求为横向条形图,按照升序排列,条形图顶部要有标签(要全部显示),选择整个视图将图表充满整个视图区,并给出分析结论;3、创建电影评分的直方图(按此命名),数据间距为0.5分,修改底部数字标签,以实际评分区间为底部标签数值,标签要显示完整,并分析电影评分直方图。数据导入产生条形图产生直方图...

#数据分析
Tableau常用函数

1.ABS(number)——返回给定数字的绝对值。ABS(-7) = 7ABS([字段])=字段中包含的所有数字的绝对值2.ATTR(expression)——如果它的所有行都有一个值,则返回该表达式的值。否则返回星号。会忽略 Null 值。其实维度也可以用聚合函数来聚合的,只是大多数维度是字符串,没办法用sum之类常用聚合函数,但max和min却是数字和字符串通吃。所以你要是愿意,用max或m

#数据分析
到底了