
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
评分模型无论是在用户评分、商家评级中都会用到,本文详细介绍了搭建评分模型的基本方法、主权赋权/客观赋权法、核心的参考代码等。

决策树是机器学习算法中的最好入手的算法之一,利用像树一样的图形来辅助决策,其可解释性强、能够转化为规则、计算速度快,应用非常广泛。在实际应用中,决策树常常作为组合算法的基模型,也被作为白盒模型,用来解释黑盒模型预测结果。本文介绍决策树的建树原理及剪枝方法。...
数据指标异常波动是产品运营以及数据分析相关岗位日常工作中较为常见的问题之一,及时监控核心指标异常波动并预警,有助于业务快速定位和发现问题(归因分析),或者捕捉业务异动信息,把握市场机会。建立完善的指标异常监控与归因方案,能够提高监控和归因的效率和准确性。本篇文章主要介绍指标异常监控和归因方案。...

业务监控的核心目标之一是及时发现并响应异常情况,在实际工作中会发现,业务指标(例如每日销售额)的异常会呈现不同的形态,如突然间过高/低,或者趋势性下降,又或者波动规律改变,每种形态背后的业务场景、预示的潜在风险都不太一样,因此识别不同的形态对于异常原因推断也相当重要。下面基于最常见的时间序列数据类型,介绍一下三种不同类型的异常及其识别方法。

我们在做AB测试时,需要用到很多的统计知识,如最小样本量、检验方法等,在这些方法之前有一个大的前提,构造检验的统计量要服从正态分布,然后才能进行接下来的统计量、p值、置信区间计算,加以判断是否统计显著。那么日常所做实验是否满足这个大前提,到底多大样本量能达到正态分布的这个大前提是本篇文章主要回答的问题。
目前精细化运营已经普及到各行各业,如何把营销成本投入到真正被运营策略打动的用户身上,而不浪费在本身就会转化用户身上,是精准营销面临的重要课题,也是提高投入产出比的重要手段,业界成熟的解决方法是Uplift Model。本文主要介绍Uplift Model的应用背景、原理及建模细节、python中如何实现。

本文较为全面的总结了AB实验涉及到的统计学知识、AB平台核心功能等,同时也给出AB不显著的分析思路,以及如何在sql中进行假设检验等,希望能够有帮助。

本文简单介绍了线形回归模型的使用场景、原理以及使用时的注意事项,下一篇会进入代码实践。
本文分别介绍了statsmodel、sklearn中如何进行逻辑回归建模,并重点就sklearn中建模时遇到的样本不平衡问题、模型调优问题进行代码练习。
在归因分析计算因子贡献度时,加法指标、乘法指标、除法指标由于指标类型的不同,所用的方法也不同,本文总结三种不同类型指标计算因子贡献度的方法,并进行具体的案例分析、公式推导、优缺点分析。
