一、背景说明

我们平常在对一些相对简单的数据集进行分类、回归、聚类模型学习时,往往会有着相对较大的代码重复工作量。因此通过这样一个代码生成系统通过可视化界面进行配置,生成探索性数据分析报告、选择配置参数进行数据清洗、构建模型等。
因为这个仅仅是出于个人使用目的,因此没有实现可拖拽式的配置。通过下拉选择不同方法,实现代码生成以及构建。

二、系统架构

在这里插入图片描述

为了方便对数据集进行存储。这里使用mongodb进行数据存储。
系统工作运行流程如下。
在这里插入图片描述

三、系统功能界面

3.1 数据导入/数据分析报告生成

针对所有导入的数据,可以进行构建探索性数据分析报告。数据分析报告通过pandas_ Profiling生成。 分析报告从数据集分析结果概览(Overview)、各变量单列描述性统计(Variables)、变量与变量之间的可视化关系(Interactions)、所有变量之间的相关矩阵热力图(Correlations)、所有数据列缺失特征(Missing values)以及数据集部分数据展示(Sample)等多个维度进行展示
在这里插入图片描述
点击生成报告后的探索性数据分析界面如下
在这里插入图片描述

3.2 数据清洗配置

在这里插入图片描述

3.3 模型构建界面配置

在这里插入图片描述
可选模型通过后台json文件进行配置
在这里插入图片描述

3.4 机器学习代码生成

在这里插入图片描述

四、源码获取

微信搜索公众号"一颗程序树"回复"aml"获取源码地址以及项目详细文档。

Logo

前往低代码交流专区

更多推荐