logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

pandas处理泰坦尼克号数据集

泰坦尼克数据集是机器学习领域中的经典案例,常用于二分类问题——预测乘客的生存情况。本项目将使用 Python 进行数据处理与建模,这里主要用到以下库:pandas & numpy:用于数据加载、处理和数值计算;matplotlib & seaborn:用于数据可视化,帮助我们直观理解数据分布和关系;scikit-learn:提供数据集划分、模型训练、超参数调优、交叉验证和模型评估等功能;jobli

文章图片
#学习#pandas
sql入门:在线零售数据分析平台

在 Orders 和 OrderDetails 表中,我们通过外键关联 Customers 和 Products 表,实现数据关联。:SQLite 将数据存储在文件中,如果文件不存在,连接时会自动创建。:当插入数据时,如果违反唯一性约束,则忽略该条数据,防止程序报错。:将数据写入 CSV 文件,其中第一行写入表头,其后写入报表数据。:在每次运行时删除旧的数据库文件,保证环境干净,有助于调试和测试。

文章图片
#学习#sql
到底了