logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

论文复现——肺癌预测数据分析与逻辑回归、朴素贝叶斯、支持向量机、随机森林、K近邻、XGBoost、深度神经网络模型评估代码解析

本研究基于肺癌调查数据集,通过机器学习方法构建了肺癌预测模型。研究流程包括数据预处理、探索性分析、特征工程和模型构建与评估。研究实现了逻辑回归、朴素贝叶斯、支持向量机、随机森林、K近邻、XGBoost和深度神经网络7种模型,其中K近邻模型表现最佳,准确率达92.86%。通过可视化分析揭示了年龄、性别分布特征及吸烟、饮酒等风险因素与肺癌的关联。研究还采用ROC曲线、混淆矩阵、PR曲线等多种评估方法,

文章图片
#数据分析#逻辑回归#支持向量机 +4
机器学习线性回归算法——原理+python详细代码解析(sklearn)

线性回归算法作为经典的机器学习算法之一,拥有极为广泛的应用范围,深受业界人士的青睐。该算法主要用于研究分析响应变量如何受到特征变量的线性影响。其通过构建回归方程,借助各特征变量对响应变量进行拟合,并且能够利用回归方程进行预测。鉴于线性回归算法较为基础、简单,所以比较容易入门。线性回归算法是一种较为基础的机器学习算法,基于特征(自变量、解释变量、因子、协变量)和响应变量(因变量、被解释变量)之间存在

文章图片
#机器学习#算法#python +4
机器学习——16种模型(基础+集成学习)+多角度SHAP高级可视化+Streamlit交互式应用+RFE特征选择+Optuna+完整项目

本研究构建了一个集成自动化机器学习全流程系统,涵盖数据预处理、模型优化、验证解释及部署应用。通过SMOTE平衡处理、Optuna超参数优化和集成学习(Voting/Stacking)构建高性能模型,并采用DCA决策曲线、校准曲线和SHAP/LIME进行深度验证与解释。系统实现了从数据清洗(包括异常值处理、特征筛选)到16种算法的全面评估(ROC曲线、AUC森林图等十多项指标),最终基于Stream

文章图片
#机器学习#集成学习#人工智能 +4
机器学习线性回归算法——原理+python详细代码解析(sklearn)

线性回归算法作为经典的机器学习算法之一,拥有极为广泛的应用范围,深受业界人士的青睐。该算法主要用于研究分析响应变量如何受到特征变量的线性影响。其通过构建回归方程,借助各特征变量对响应变量进行拟合,并且能够利用回归方程进行预测。鉴于线性回归算法较为基础、简单,所以比较容易入门。线性回归算法是一种较为基础的机器学习算法,基于特征(自变量、解释变量、因子、协变量)和响应变量(因变量、被解释变量)之间存在

文章图片
#机器学习#算法#python +4
机器学习-XGBoost和SHAP解析数据

接下来,通过切片操作从 shap_values 中提取出每个类别的 SHAP 值,分别存储shap_values_class_1,shap_values_class_2 和 shap_values_class_3 中。为后续的工作准备好所需的工具,我们需要引入如 numpy 、pandas 用于数据处理,xgboost 用于模型构建,用于模型解释的shap,用于可视化的seaborn和matplo

文章图片
#机器学习#人工智能#数据分析 +1
到底了