
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
数据分析:利用统计分析方法,从数据中提取有用的信息,并进行总结和概括的过程。Python 的胶水特性:Python 可以粘合其它语言代码段。一、数据获取手段 1)数据仓库将所有业务数据汇总处理,构成数据仓库(DW);特点:全部事实的记录(必须是全面的、完备的、尽可能详细的);可以方便的以不同维度抽取和整理数据(数...
定义数据挖掘:从大量数据中挖掘有趣模式和知识的过程。一、知识发现过程 1)数据预处理 1、数据清理:消除噪声和删除不一致数据; 2、数据集成:多种数据源组合在一起。 3、数据选择:从数据库中提取与分析任务相关的数据。 4、数据变换:通过汇总或聚集操作,把数据变换和统一成适合挖掘的形式。 2)数据挖掘 基本步骤、使用智能方法提取数据模式...
一、概述现实中的数据一般有噪声、数量庞大并且可能来自异种数据源。数据集由数据对象组成,一个数据对象代表一个实体。数据对象:又称样本、实例、数据点或对象。数据对象以数据元组的形式存放在数据库中,数据库的行对应于数据对象,列对应于属性。属性是一个数据字段,表示数据对象的特征,在文献中,属性、维度(dimension)、特征(feature)、变量(variance)可...
一、删除字符串两端的一种或多种字符#strip()、lstrip()、rstrip()方法;(默认删除空格符)A、list.strip(字符):删除字符串两端的一种或多种字符;#例:删除字符串s两端 a 或 b 或 c 字符;s = 'abbmmmcccbbb's1 = s.strip('abc')print(s1)#输出:mmmB、list....