
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
第二部分 电商离线数仓 全套项目代码(可直接在你伪分布式 Hive 运行)
sql2. ODS 层 外部表(用户行为日志)sql3. DWD 明细层 清洗表sql4. DWS 汇总层 用户日活宽表sql5. ADS 应用层 业务报表层sql6. 查询最终报表(可直接看结果)sql使用说明你直接把上面 SQL 按顺序在 Hive 执行,伪分布式集群完全能跑通;项目架构:ODS→DWD→DWS→ADS 四层数仓分层,标准企业级流程,直接写进简历;每天一边背我给你的面试口述版,
特征工程 10 大核心知识点终极总结(面试 / 考试直接满分)
特征工程 = 把原始业务数据,清洗、转换、筛选成「模型能高效学习、业务能解释」的优质特征的全过程。用最少、最准的特征,让模型效果最好、最稳定、最可解释。多个输入特征之间高度相关,互相重复信息,相当于给模型喂了 “重复的话”比如:同时用「身高 (cm)」和「身高 (m)」、「月消费」和「年消费」,就是典型的多重共线性。
SQL → Hive → Python 数据分析 → 机器学习 / AI 基础
【代码】SQL → Hive → Python 数据分析 → 机器学习 / AI 基础。
SQL → Hive → Python 数据分析 → 机器学习 / AI 基础
【代码】SQL → Hive → Python 数据分析 → 机器学习 / AI 基础。
到底了







