logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【数据分析面试】42.用户流失预测模型搭建(资料数据分享)

保持高的客户留存率可以稳定和提到企业的收入。因此,预测和防止客户流失是在业务中常见的一项数据分析任务。这次分享的数据集包括了电信行业、银行、人力资源和电商行业,涵盖了不同业务背景下的流失预测数据。

文章图片
#数据分析#面试#机器学习
SQL淘宝用户数据分析

本项目使用sql和Excel对淘宝用户行为数据进行分析和可视化展示,通过建立用户行为转化漏斗模型、商品销售分析、使用RFM模型对用户分层,找到针对不同商品、用户群体的营销策略。

【数据分析面试】31. 产品销售额排名(SQL窗口函数)

写一条SQL查询,求每个销售日期内的产品销售额的排名,结果按照销售日期顺序排列。

文章图片
#面试#sql#数据库 +1
探索性数据分析EDA(二)—— 缺失值处理

主要内容为缺失值处理方法介绍,以及相关python代码及sklearn.impute的使用介绍。

#数据分析#python
【数据分析面试】49. 计算分公司的总销售额(Python:groupby & merge用法)

你在一家跨国零售公司工作,全球各分公司的销售数据都存储在不同的表格中。当前的数据结构在业务分析中表现低效,管理层需要你提供专业知识来简化数据。编写一个Python程序,创建一个数据表,显示每个分支机构每年的总销售额。

文章图片
#数据分析#python#面试
【数据分析面试】5.地址信息数据清洗合并 (Python)

来创建一个单一的数据框,其中包含完整的地址,格式为街道、城市、州、邮政编码。一个包含有关地址的信息,另一个包含了不同城市和州之间的关系。

文章图片
#python#数据分析#面试
【数据分析面试】37.找出连续出现3次的数字(SQL:LEAD()和 LAG()的使用)

给定一个日志表 `Logs`,包含两列:`Id` 和 `Num`。请编写一个 SQL 查询,找出在 `Num` 列中连续出现至少三次的数字。

文章图片
#sql#数据库#面试 +1
【数据分析面试】56.数据格式转换(Python:melt函数)

给定一个df,包含ABCDE多个列。请编写一个 Python 程序,将列 'D' 和 'E' 转换为长格式,并使用 'A'、'B' 和 'C' 作为标识符。

文章图片
#数据分析#python#面试
【数据分析面试】51. 读取大型csv文件

假设你是一家科技公司的数据分析师。近期由于管理层变动,新的总经理上任,他想要了解公司过往的交易情况数据,并且这个任务由数据分析团队负责完成。历史交易数据下载导出完成后,团队发现Csv文件大小超过了5个G,使用pandas读取时间过长。你有什么好的解决办法吗?

文章图片
#数据分析#python#pandas
【数据分析面试】60.计算滑动窗口平均值 (Python & SQL)

给定一个数字列表 `nums` 和一个整数 `window_size`,编写一个函数 `moving_window` 来计算滑动窗口平均值。

文章图片
#数据分析#python#面试 +1
    共 92 条
  • 1
  • 2
  • 3
  • 10
  • 请选择