
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
八大数据分析模型
留存分析模型:统计日登陆且统计日前一日也登陆的用户,为新用户统计日登陆且与前一次登陆时间间隔小于7天,为老活跃用户,反应产品真实的活跃情况统计日登陆且与前一次登陆时间间隔等于7天, 为回流用户统计日登陆且与前一次登陆时间间隔大于7天,为沉默用户统计日与前一次登陆时间间隔大于30天, 为流式用户, 用来衡量老用户召回的功能或渠道推广,重大节日活动是否有效等周留存:这周新增的用户在下周任然...
ETL的开发过程
在生产环境中, 使用shell脚本完成一次etl操作1.定义一个etl函数, 里面传入json行数据, 用json.loads加载行数据,并对行数据进行判断,如果没有行数据,或data字段没有在行数据里, 就直接返回空的结果, 否则就继续往下执行2.接着获取行里的数据, 用for循环判断, 如果包含某个值, 我就将变量赋值取出, 装在集合容器里3.设置sparksession会话, 并ena...
到底了







