logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据挖掘-关联分析 Apriori算法和FP-growth 算法

•1.关联分析概念关联分析是从大量数据中发现项集之间有趣的关联和相关联系。•定义:1、事务:每一条交易称为一个事务,如上图包含5个事务。2、项:交易的每一个物品称为一个项,例如豆奶,啤酒等。 3、项集:包含零个或多个项的集合叫做项集,例如{尿布,啤酒}。4、k−项集:包含k个项的项集叫做k-项集,例如 {豆奶,橙汁}叫做2-项集。5、支持度计数:一个项集出现在几个事务当...

#数据挖掘#python
数据分析实例-MovieLens 1M 数据集

MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。分为三个表:评分,用户信息,电影信息。这些数据都是dat文件格式。读取3个数据集:#coding=gbk# MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。# 分为三个表:评分,用户信息,电影信息。这些数据都是dat文件格式# ,可以通...

#数据分析#pandas#python
(软著源代码编写)python提取多级目录下的.java文件,并将其内容保存到word

一个小需求:在申请软件著作权的时候,需要提交一页50行,总共60页的源代码。但是设计的项目保存在多级的目录下,不想一个一个复制,遂通过python ,os模块获得全部目录的文件,re正则化过滤无效源代码,然后基于docx模块写入到word中。涉及的模块有 os, docx, re分为2 个大的步骤:1. 先将一个文件夹下的所有文件夹的 .java 文件路...

使用python依次读取文件中的所有csv格式的数据

使用python依次读取文件中的所有csv格式的数据:#coding=gbkimport pandas as pdimport ospath = r'D:\ml_datasets\PHM\c6'def get_file():#创建一个空列表files =os.listdir(path)files.sort() #排序...

#pandas
决策树中信息、熵、信息增益、基尼指数的概念及其python实现

from:http://www.cnblogs.com/fantasy01/p/4581803.html?utm_source=tuicooland参考:周志华《机器学习》决策树参考:https://blog.csdn.net/qq_40587575/article/details/80889223关于对信息、熵、信息增益是信息论里的概念,是对数据处理的量化,这几个概念主要...

#决策树
参数检验和非参数检验

一、参数检验1、基本思想2、两类错误3.、检验步骤4、检验的p值在一个假设检验问题中, 拒绝原假设H0的最小显著性水平称为检验的p值.5、单正态总体参数的检验(1)(2)(3)6、两正态总体参数的检验(1)(2)7、成对数据的t检验所谓成对数据, 是指两个样本的样本容量相等, 且两个样本之间除均值之外没有另的差异.8、单样本比率的检验(1)比率p的精确检验(2)比率p的近似检验9、两样本比率的检验

数据分析实例-MovieLens 1M 数据集

MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。分为三个表:评分,用户信息,电影信息。这些数据都是dat文件格式。读取3个数据集:#coding=gbk# MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。# 分为三个表:评分,用户信息,电影信息。这些数据都是dat文件格式# ,可以通...

#数据分析#pandas#python
小波变化与小波降噪

FROM:https://blog.csdn.net/zhang0558/article/details/76019832小波变换和小波阈值法去噪1. 小波变换小波变换是一种信号的时间——尺度(时间——频率)分析方法,它具有多分辨分析的特点,而且在时频两域都具有表征信号局部特征的能力,是一种窗口大小固定不变但其形状可改变,时间窗和频率窗都可以改变的时频局部化分析方法。即在低频部分具有...

解决pyinstaller打包sklearn等库出现的问题: 提示failed to execute script xxx

pyinstaller安装,简单打包可以参考:https://blog.csdn.net/qq_40587575/article/details/85076934------------------------------------------------------------------------------------------------------------------...

#python#sklearn
箱形图含义

箱形图,也叫盒须图,盒式图,boxplot。1.什么是箱形图?箱图的发明者JohnTukey。Tukey先生1915年出生于美国麻省的新贝德福德。他22岁的时候在布朗大学获得了硕士学位,之后又在普林斯顿大学拿到了化学博士。有趣的是,他并没有直接开始让他青史留名的统计学工作,而是在二战期间进入了火控研究室,在那里,大量武器相关的研究最终都转而需要先解决统计学问题。从此,Tukey改变了...

#r语言
    共 25 条
  • 1
  • 2
  • 3
  • 请选择