logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从零开始,手把手教你玩转Kaggle比赛!

你是否对数据科学和机器学习充满好奇,却苦于找不到合适的实战机会?你是否想提升自己的编程和建模能力,却不知道从哪里开始?如果你有这些困惑,那么Kaggle就是你最好的选择!作为全球最大的数据科学竞赛平台,Kaggle不仅为你提供了海量的数据集和真实的业务场景,还能让你与全球顶尖的数据科学家同台竞技,快速提升自己的技能。

文章图片
#人工智能#机器学习#python
数据分析中最好用的估算法:费米思想

在数据分析面试中,主考官常提出看似无解的问题,如估算新生儿数量或城市垃圾重量,这实际上是在考察应试者的数据思维能力。这类问题被称为费米问题,源自物理学家费米,其核心思想是通过逻辑拆解将复杂问题分解为可解决的小问题,再通过估算和假设逐步反推答案。费米估算法强调估算上下界,并利用平均律理论,使误差相互抵消,从而提高估算的准确性。这种思维方式不仅适用于数据分析,也能帮助我们在信息不全的情况下做出更准确的

文章图片
#数据分析#数据挖掘
数据分析师成长之路

说到数据分析师,都以为是别人眼中高大上的工作,其实数据分析师是最苦的一份工作,虽然说数据分析很苦,但是能够给你带来的东西、带来的数据思维很有益处;接下来我就以从事多年的数据分析为大家揭秘数据分析师的工作以及这份工作能够为你带来什么?以及我是如何成为一名数据分析师的呢?

文章图片
#数据分析#大数据#面试 +3
宇宙最强anaconda安装第三方库粗暴法

第一步找到:【Environments】------》〉》〉第二步:选中【All】------》〉》第三步:在搜索框中选择需要安装的第三方包------》〉》第四步:勾选搜索到的第三方包。第五步到最后一直点击【Apply】。

文章图片
#python
EDA--三井物产商品预测挑战赛 Exploratory Data Analysis(探索性数据分析)

本文介绍了三井物产商品预测竞赛中的探索性数据分析(EDA)方法。比赛需预测424个价差序列的对数收益率,核心难点在于处理多市场交易时间不一致和结构性断点问题。作者通过计算连续收益率、分析价格波动性、绘制相关性热力图等方法理解数据特征,提出针对高/低波动性分别建模的策略。文章展示了数据预处理、特征工程和模型构建思路,特别强调了EDA在发现数据规律、识别异常波动期(如用20日滚动标准差标记高波动区间)

文章图片
#数据分析#人工智能#机器学习
数据分析常考面试题 101 题-业务题(45 道)、SQL(18 道)、统计学(14 道)、机器学习(24 道)

数据分析面试通常考查候选人的数据工具能力和业务分析思维。数据工具能力方面,SQL是常考内容,而业务分析思维则涉及对业务场景的理解和分析。面试中可能会问到如何理解数据分析、数据分析的价值、指标异常波动的分析、注册类与活跃类指标的选择、圆周率计算算法设计、星巴克门店销售额估算、指标与维度的区别、北极星指标与虚荣指标的定义、指标体系的建立方法以及A/B测试的核心原理和应用场景。通过这些问题的详细讲解,候

文章图片
#数据分析#机器学习#数据挖掘
数据分析必学案例--波士顿犯罪分析

EDA,在数据清洗和建模工作之前,对数据集的分布有一个总体的认识。探索各个特征之间的关系。EDA部分的主要工作在于数据可视化,前提是对数据做了初步的预处理工作。在本例子中,将许多object类型的数据转化为了category类型。熟悉sns.countplot(),sns.boxplot(),sns.kdeplot(),sns.lineplot(),sns.heatmap(),sns.scatte

文章图片
#数据分析#数据挖掘#机器学习 +4
python之数据结构与算法篇

快排,堆排,归并排序详细原理参考这篇这或许是东半球分析十大排序算法最好的一篇文章,下面我将用 Python 快速实现出来。话不多说,Show MeCode!

文章图片
#python#算法#数据结构 +3
EDA--三井物产商品预测挑战赛 Exploratory Data Analysis(探索性数据分析)

本文介绍了三井物产商品预测竞赛中的探索性数据分析(EDA)方法。比赛需预测424个价差序列的对数收益率,核心难点在于处理多市场交易时间不一致和结构性断点问题。作者通过计算连续收益率、分析价格波动性、绘制相关性热力图等方法理解数据特征,提出针对高/低波动性分别建模的策略。文章展示了数据预处理、特征工程和模型构建思路,特别强调了EDA在发现数据规律、识别异常波动期(如用20日滚动标准差标记高波动区间)

文章图片
#数据分析#人工智能#机器学习
数据分析常考面试题 101 题-业务题(45 道)、SQL(18 道)、统计学(14 道)、机器学习(24 道)

数据分析面试通常考查候选人的数据工具能力和业务分析思维。数据工具能力方面,SQL是常考内容,而业务分析思维则涉及对业务场景的理解和分析。面试中可能会问到如何理解数据分析、数据分析的价值、指标异常波动的分析、注册类与活跃类指标的选择、圆周率计算算法设计、星巴克门店销售额估算、指标与维度的区别、北极星指标与虚荣指标的定义、指标体系的建立方法以及A/B测试的核心原理和应用场景。通过这些问题的详细讲解,候

文章图片
#数据分析#机器学习#数据挖掘
    共 13 条
  • 1
  • 2
  • 请选择