
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
数据挖掘过程中,数据预处理占整个过程的60%,主要分为以下四个步骤:数据清洗的主要目的是为了删除原始数据集中的无关数据、重复数据、平滑噪声数据、处理缺失值、异常值等。处理缺失值的方法可分为三类:删除数据、数据插补和不处理,常见的数据插补方法见下表:插值法有:Hermite插值、分段插值、样条插值法,而最主要的有拉格朗日插值法和牛顿插值法。1.1.2 牛顿插值法1.2 异常值处理在数据预处理时,异常

一、前言第24届冬季奥林匹克运动会在北京隆重展开,我们要研究一个问题:奥运会东道主是否有优势?在历史数据中,我们发现好像东道主的国家在当年奥运会上获得金牌的数目比四年前非东道主国家获得的金牌数多,我们需要探究这个规律。二、历史背景回归(regression)一词,来源于遗传对身高的影响的分析。父母的高矮,对子女有影响;但另一方面,个子特高的父母,子女会一般比他们矮;个子特矮的父母,子女比他们高。

当我们拿到一篇赛题的时候,脑袋很蒙不知道如何下手,最直接的方法就是搜相关的问题找到解决问题的答案。在实际比赛中我们也是这样做的,遇到一个陌生的赛题首先到知网上查找相应的论文,再到B站、github、csdn上看能不能找到相应的代码,如果找不到就得自己手敲了。数学建模最重要的应该是对模型的理解,对具体问题对象的应用,要分析的出模型哪好哪不好,如何优化?模型的敏感性如何?说白了,我们必须从逻辑上和从结
开源量化平台:Veighna是一个开源的量化平台,这意味着它的代码是公开的,任何人都可以查看和修改。不同的平台可能有不同的特点和优势,可以根据自己的需求选择适合的平台。:对于一些敏感的策略和交易数据,安全性和保密性是非常重要的。Bigquant:基于云端的量化平台,提供数据分析、策略回测等功能,适用于中小散A股的个人量化投资。掘金:老牌的量化投资工具集平台,提供丰富的功能和工具集,适用于中低频类型








