
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
构建了8种机器学习的融合模型stacking模型进行用户购买行为的预测。

对电商的商品评论爬取,然后进行分词等预处理,构建LDA模型,词云图,共现网络图等

对电商直播间的评论数据进行可视化分析,数量分析,趋势分析,内容分析,主题分类分析(LDA建模)

本研究基于2015-2024年数据,采用多元回归方法分析了12个宏观经济变量对沪深300指数的影响。在解决多重共线性问题(剔除M0和M2)后,沪深300指数走势主要受三大因素驱动:投资者情绪波动, 全球金融环境变化, 通胀预期调整。

本案例就是一个分类问题的全流程展示。用各种特征去预测客户对这个航空公司的体验是不是满意的一个分类模型,包括数据的预处理,探索性分析变量的可视化特征工程,特征组合数据标准化模型的选择和构建模型的训练对比评估,评价指标,变量重要性排序以及模型的解释。解释用的是shap包。

本文基于营销活动数据集,通过数据分析和机器学习模型预测客户购买行为。包括数据的读取,清洗,预处理,特征工程,可视化,模型对比,超参数搜索,特征重要性风险,模型评估。研究发现客户对营销活动的响应与最近消费时间、注册时长及特定活动参与度显著相关,而学历和婚姻状态影响较小。采用梯度提升模型表现最佳(AUC=0.87,KS=0.586),能有效预测客户行为。

机器学习全流程,读取数据,探索性分析,可视化,预处理,特征工程,异常值处理。建模,模型对比,交叉验证,超参数搜索,模型评估,特征变量重要性。

基于征信数据构建了一个机器学习风控模型。研究首先对多源征信数据进行合并、清洗和特征工程,包括缺失值处理、异常值处理、变量标注等。通过可视化分析变量分布特征后,采用重采样技术处理样本不平衡问题。实验比较了10种分类算法,最终选择随机森林模型并进行超参数优化。

图结构数据,将道路间的距离作为边的权重,利用图卷积层提取空间特征,再通过LSTM层处理时间序列数据,进行交通流量预测。

进出口外贸数据,进行交互式图表的可视化分析。








