logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

SQL、Pandas和Spark:这个库,实现了三大数据分析工具的大一统

导读看过近期推文的读者,想必应该知道笔者最近在开一个数据分析常用工具对比的系列,主要是围绕SQL、Pandas和Spark三大个人常用数据分析工具,目前已完成了基本简介、数据读取、选取特定...

#大数据#python#数据分析 +2
一文介绍机器学习中的三种特征选择方法

导读机器学习中的一个经典理论是:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限。也正因如此,特征工程在机器学习流程中占有着重要地位。广义的特征工程一般可分为三个环节:特征提取...

#算法#机器学习#人工智能 +2
一张图介绍机器学习中的集成学习算法

导读机器学习在当下早已成为一项热门的技术,在众多机器学习算法中,除去深度学习和强化学习等最新发展方向,若是谈及经典机器学习算法,那么集成学习算法无论是在效果上还是热度上都是当之无愧的焦点。...

#机器学习#人工智能#大数据 +2
时序预测的三种方式:统计学模型、机器学习、循环神经网络

导读时序预测是一类经典的问题,在学术界和工业界都有着广泛的研究和应用。甚至说,世间万物加上时间维度后都可抽象为时间序列问题,例如股票价格、天气变化等等。关于时序预测问题的相关理论也极为广泛...

#python#神经网络#机器学习 +2
PyTorch学习系列教程:构建一个深度学习模型需要哪几步?

导读继续PyTorch学习系列。前篇介绍了PyTorch中最为基础也最为核心的数据结构——Tensor,有了这些基本概念即可开始深度学习实践了。本篇围绕这一话题,本着提纲挈领删繁就简的原则...

#神经网络#大数据#python +2
Pandas中的这3个函数,没想到竟成了我数据处理的主力

导读学Pandas有一年多了,用Pandas做数据分析也快一年了,常常在总结梳理一些Pandas中好用的方法。例如三个最爱函数、计数、数据透视表、索引变换、聚合统计以及时间序列等等,每一...

#python#大数据#数据分析 +2
时序预测的三种方式:统计学模型、机器学习、循环神经网络

导读时序预测是一类经典的问题,在学术界和工业界都有着广泛的研究和应用。甚至说,世间万物加上时间维度后都可抽象为时间序列问题,例如股票价格、天气变化等等。关于时序预测问题的相关理论也极为广泛...

#python#神经网络#机器学习 +2
最近,深入研究了一下数据挖掘竞赛神器——XGBoost的算法原理和模型数据结构...

导读从事数据挖掘相关工作的人肯定都知道XGBoost算法,这个曾经闪耀于数据挖掘竞赛的一代神器,是2016年由陈天齐大神所提出来的经典算法。本质上来讲,XGBoost算作是对GBDT算法的...

#决策树#算法#数据挖掘 +2
时序预测的三种方式:统计学模型、机器学习、循环神经网络

导读时序预测是一类经典的问题,在学术界和工业界都有着广泛的研究和应用。甚至说,世间万物加上时间维度后都可抽象为时间序列问题,例如股票价格、天气变化等等。关于时序预测问题的相关理论也极为广泛...

#python#神经网络#机器学习 +2
一文介绍机器学习中的三种特征选择方法

导读机器学习中的一个经典理论是:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限。也正因如此,特征工程在机器学习流程中占有着重要地位。广义的特征工程一般可分为三个环节:特征提取...

#算法#机器学习#人工智能 +2
    共 14 条
  • 1
  • 2
  • 请选择