logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据可视化及初步探索

本文将介绍数据可视化中静态图形的绘制,并学习 Python 中两个十分出色的数据可视化模块 Matplotlib 和 Seaborn。最后,利用所学的可视化知识,对经典数据分析 iris 数据集进行初步的数据探索。

文章图片
#信息可视化#数据可视化#数据挖掘 +2
数据预处理之数据清洗

原始数据一般会十分凌乱。不仅数据结构不满足需要,键值也可能存在错误甚至缺失。此时,数据预处理的重要性就突显出来了。数据预处理是一个产生有效数据的过程,即通过自动化、半自动化、甚至手动操作等手段将原始数据文件或者数据仓库里面的数据,处理成能输入到训练模型中的数据。数据预处理是数据挖掘和模型构建过程中十分重要的步骤。对没有经过预处理的数据进行分析,结果是没有任何意义的。使用没有经过预处理的数据训练模型

#大数据
到底了