
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
•1.关联分析概念关联分析是从大量数据中发现项集之间有趣的关联和相关联系。•定义:1、事务:每一条交易称为一个事务,如上图包含5个事务。2、项:交易的每一个物品称为一个项,例如豆奶,啤酒等。 3、项集:包含零个或多个项的集合叫做项集,例如{尿布,啤酒}。4、k−项集:包含k个项的项集叫做k-项集,例如 {豆奶,橙汁}叫做2-项集。5、支持度计数:一个项集出现在几个事务当...
MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。分为三个表:评分,用户信息,电影信息。这些数据都是dat文件格式。读取3个数据集:#coding=gbk# MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。# 分为三个表:评分,用户信息,电影信息。这些数据都是dat文件格式# ,可以通...
一个小需求:在申请软件著作权的时候,需要提交一页50行,总共60页的源代码。但是设计的项目保存在多级的目录下,不想一个一个复制,遂通过python ,os模块获得全部目录的文件,re正则化过滤无效源代码,然后基于docx模块写入到word中。涉及的模块有 os, docx, re分为2 个大的步骤:1. 先将一个文件夹下的所有文件夹的 .java 文件路...
使用python依次读取文件中的所有csv格式的数据:#coding=gbkimport pandas as pdimport ospath = r'D:\ml_datasets\PHM\c6'def get_file():#创建一个空列表files =os.listdir(path)files.sort() #排序...
from:http://www.cnblogs.com/fantasy01/p/4581803.html?utm_source=tuicooland参考:周志华《机器学习》决策树参考:https://blog.csdn.net/qq_40587575/article/details/80889223关于对信息、熵、信息增益是信息论里的概念,是对数据处理的量化,这几个概念主要...
一、参数检验1、基本思想2、两类错误3.、检验步骤4、检验的p值在一个假设检验问题中, 拒绝原假设H0的最小显著性水平称为检验的p值.5、单正态总体参数的检验(1)(2)(3)6、两正态总体参数的检验(1)(2)7、成对数据的t检验所谓成对数据, 是指两个样本的样本容量相等, 且两个样本之间除均值之外没有另的差异.8、单样本比率的检验(1)比率p的精确检验(2)比率p的近似检验9、两样本比率的检验
MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。分为三个表:评分,用户信息,电影信息。这些数据都是dat文件格式。读取3个数据集:#coding=gbk# MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。# 分为三个表:评分,用户信息,电影信息。这些数据都是dat文件格式# ,可以通...
FROM:https://blog.csdn.net/zhang0558/article/details/76019832小波变换和小波阈值法去噪1. 小波变换小波变换是一种信号的时间——尺度(时间——频率)分析方法,它具有多分辨分析的特点,而且在时频两域都具有表征信号局部特征的能力,是一种窗口大小固定不变但其形状可改变,时间窗和频率窗都可以改变的时频局部化分析方法。即在低频部分具有...
pyinstaller安装,简单打包可以参考:https://blog.csdn.net/qq_40587575/article/details/85076934------------------------------------------------------------------------------------------------------------------...







