logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

心脏病数据分析

本研究基于1314例心脏病患者数据,通过系统分析和机器学习建模揭示心脏病风险因素。数据清洗阶段处理了极端异常值和逻辑错误(如收缩压/舒张压反序)。关键发现:心脏病患者的CK-MB和肌钙蛋白水平显著高于非患者,男性及高龄(>55岁)人群风险更高。构建的XGBoost模型表现最优(AUC=0.94),优于逻辑回归和SVM,其核心预测因子为肌钙蛋白(重要性35%)、CK-MB(28%)和年龄(22%)。

文章图片
#r语言#开发语言#青少年编程
脱发因素数据分析

脱发数据分析与预测研究摘要 本研究基于Python工具对脱发影响因素进行系统分析。通过Pandas库处理包含遗传、荷尔蒙、医疗状况等12个维度的脱发数据集,包括数据清洗、缺失值处理和二值化转换。采用Matplotlib可视化分析,发现脱发与年龄、压力水平、遗传因素等存在显著关联。研究构建了随机森林和支持向量机预测模型,通过特征工程和标签编码处理分类变量。结果显示遗传与高压力组合因素对脱发影响尤为突

文章图片
#python#jupyter#vscode +3
Hadoop技术学习后心得

本文总结了Hadoop技术的学习心得,重点介绍了Hadoop核心组件(HDFS、MapReduce、YARN)的理论知识和实践应用。通过搭建集群环境、编写MapReduce程序(如单词统计)等实践,掌握了数据处理优化技巧。文章还展示了代码模块化、封装和测试的方法,并提出了未来学习Hive、Spark等生态组件,以及机器学习与大数据结合的研究方向。全文包含从基础概念到项目优化的完整学习路径,为大数据

文章图片
#hadoop#大数据#分布式 +2
到底了