
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本次实验包含两个连贯的数据挖掘实验,依托助睿数智Uniplore零代码平台完成。第一部分为学生用户画像-考勤主题扩展标签构建,利用K-Means无监督聚类算法,以学生在校迟到、早退、请假、校服违规四类考勤行为数据为特征维度,对全体学生进行自动化人群分群,生成标准化学生考勤分类标签,完成原始数据表的标签扩充;第二部分为学生用户画像-考勤画像可视化分析。
本文在助睿数智(Uniplore)平台上探索更复杂的ETL场景——学生考勤画像标签构建。实验整合考勤流水、类型字典、学生信息三张表,通过9种组件类型共16个组件的编排,完成多表关联、JavaScript行为标记、分组聚合、维度衍生和标准化输出,最终生成包含年级、校区、住校状态等维度及四类行为指标的标签宽表。本教程适合有一定基础、希望进阶掌握零代码ETL的读者参考

最近在学习数据分析时,接触到了一个很有意思的概念——ETL。可能很多刚入门的同学会问:ETL到底是个啥?E(Extract,抽取):从各种数据源中把数据取出来T(Transform,转换):对数据进行清洗、计算、关联等加工处理L(Load,加载):把处理好的数据存到目标位置举个生活中的例子,就像做菜:先把菜从冰箱拿出来(Extract),然后洗菜切菜炒菜(Transform),最后装盘上桌(Loa
本研究基于某校全寄宿制高中46万余条消费记录,采用"双层筛选模型"从1,730名学生中精准识别出130名核心困难学生(占全校7.5%),并通过孤立森林交叉验证(重叠率43.08%),验证了识别结果的稳健性。从"经验判断"到"数据驱动",从"统一发放"到"分层滴灌",教育大数据正在让校园资助工作变得更精准、更有温度。本文构建的双层筛选模型和三层资助体系,仅是一个起点。我们相信,每一份助学金都应当精准







