
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
文章目录#数据预处理,特征选择的目的是改善数据质量,体现数据的本质特征,降低计算成本,提升模型的表现。特征选择–主要分为三个模块:特征提取(Features Extraction):如从文本型数据提取日期型数据;从非结构化数据(文本,视频,音频等)提取数据。如:Web爬取等;特征创建(Features Creation):通过组合,计算等方法,得到原本不存在的特征(必须是合理的);特征选择(Fea
文章目录一、数据整理1. 电影类型随时间变化怎么样?2. 电影类型与利润的关系3. 电影的投入与利润的关系4. Universal和Paramount两家影视公司的对比情况如何?5. 改编电影和原创电影以及评分情况如何6. 电影时长与电影票房以及评分的关系7. 分析电影关键字8.分析演员的关联度(社会网络计算)9.分析演员的词云一、数据整理budget:电影成本genres:风格列表,按|分隔,最
文章目录一、KNN1、K值的判断与选取2、缺失值差填补3、KNN填充和模型评估4、RESSION一、KNNKNN最邻近分类算法的实现原理:为了判断未知样本的类别,以所有已知类别的样本作为参照,计算未知样本与所有已知样本的距离,从中选取与未知样本距离最近的K个已知样本,根据少数服从多数的投票法则(majority-voting),将未知样本与K个最邻近样本中所属类别占比较多的归为一类。KNN属于懒惰
文章目录Python Tuple1、创建空元组2、使用不同的数据类型创建元组3、创建只有一个元素的元组4、在元组中添加项5、元组转换为字符串join函数6、解压缩几个变量中的元组Python Tuple1、创建空元组Python的元组与列表类似,不同之处在于元组的元素不能修改【1】元组使用小括号,列表使用方括号【2】元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可【3】元组(tuple)
文章目录一、降维究竟是怎样实现的二维特征矩阵降维的一般过程PCA降维与特征选择的不同:重要参数n_components迷你案例:高维数据的可视化6、探索降维后的数据最大似然估计自选超参数按信息量占比选超参数1、一、降维究竟是怎样实现的【1】降维:减少特征,删除数据,模型受影响【2】噪音:【3】PCA使用样本方差二维特征矩阵降维的一般过程过程二维特征矩阵n维特征矩阵1输入原数据,结构为(2,3)23
文章目录一、含正负号的下标二、loc和iloc1. 利用loc、iloc提取行数据2. 利用loc、iloc提取列数据3.利用loc、iloc提取指定行、指定列数据4.利用loc、iloc提取所有数据5.利用loc函数,根据某个数据来提取数据所在的行一、含正负号的下标正下标从0开始,负下标从-1开始1。切片的时候包括头不包括尾部。二、loc和ilocloc是指location的意思,iloc中的i
文章转载自:https://www.pynote.net/archives/1372python浮点数舍入1. ROUND DOWN2. ROUND FLOOR3. ROUND HALF EVEN4. ROUND CEILING5. ROUND UP6. ROUND HALF DOWN7. ROUND HALF UP8. ROUND 05UP1. ROUND DOWNROUND DOWN的含义是,

文章目录一、替换(1)替换考点(2)手动换行符(3)段落标记(4)删除空白行(5)全角与半角空格(6)尾注替换二、选择(1)矩形选则(2)相似文本选则(3)显示隐藏图片(4)选择性粘贴(5)格式刷三、封面(1)插入系统性封面(2)自制型封面1.文本框2.图片格式四、图形(1)新建形状(2)删除背景(3)设置透明色(4)压缩图片大小(5)设置艺术效果(6)裁剪图片(7)旋转图片(8)更改图片大小(9
本篇博客主要以员工贡献度为例,分析不同菜品之间是否存在相关性。最典型的应用就是:啤酒和尿布销售之间的联系文章目录一、周期性分析二、贡献性分析三、相关性分析1、探究不同菜品之间的相关性2、探究不同学生之间的相关性一、周期性分析探索某个变量是否随着时间变化而呈现出某种周期性变化的趋势。时间尺度相对较长的周期性趋势有:年度周期性趋势,季节性周期性趋势,相对较短的有月度周期性趋势,周度周期性趋势,甚至更短
注:本篇文章参考:b站:机器学习经典算法——回归算法文章目录一、机器学习简介二、回归算法三、支持向量机要解决的问题四、支持向量机求解目标五、核函数变换一、机器学习简介机器学习应用的领域非常广泛:数据挖掘:分析用户信息,提高用户对产品的依赖性。计算机视觉:无人驾驶汽车–实时进行检测任务机器学习的步骤:1、训练样本2、特征提取(数据科学家:知道一份数据如何是机器能更好的识别特征)3、学习函数4、预测N