
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
保持高的客户留存率可以稳定和提到企业的收入。因此,预测和防止客户流失是在业务中常见的一项数据分析任务。这次分享的数据集包括了电信行业、银行、人力资源和电商行业,涵盖了不同业务背景下的流失预测数据。

本项目使用sql和Excel对淘宝用户行为数据进行分析和可视化展示,通过建立用户行为转化漏斗模型、商品销售分析、使用RFM模型对用户分层,找到针对不同商品、用户群体的营销策略。
写一条SQL查询,求每个销售日期内的产品销售额的排名,结果按照销售日期顺序排列。

主要内容为缺失值处理方法介绍,以及相关python代码及sklearn.impute的使用介绍。
你在一家跨国零售公司工作,全球各分公司的销售数据都存储在不同的表格中。当前的数据结构在业务分析中表现低效,管理层需要你提供专业知识来简化数据。编写一个Python程序,创建一个数据表,显示每个分支机构每年的总销售额。

来创建一个单一的数据框,其中包含完整的地址,格式为街道、城市、州、邮政编码。一个包含有关地址的信息,另一个包含了不同城市和州之间的关系。

给定一个日志表 `Logs`,包含两列:`Id` 和 `Num`。请编写一个 SQL 查询,找出在 `Num` 列中连续出现至少三次的数字。

给定一个df,包含ABCDE多个列。请编写一个 Python 程序,将列 'D' 和 'E' 转换为长格式,并使用 'A'、'B' 和 'C' 作为标识符。

假设你是一家科技公司的数据分析师。近期由于管理层变动,新的总经理上任,他想要了解公司过往的交易情况数据,并且这个任务由数据分析团队负责完成。历史交易数据下载导出完成后,团队发现Csv文件大小超过了5个G,使用pandas读取时间过长。你有什么好的解决办法吗?

给定一个数字列表 `nums` 和一个整数 `window_size`,编写一个函数 `moving_window` 来计算滑动窗口平均值。
