logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

免费的机器学习数据集,分类与回归

今天为大家精心整理了10大类最常用的免费机器学习数据集,无论你是要做分类还是回归任务,这里统统都有!为避免大家逐个寻找,我已将所有数据集整理打包(含国内镜像下载地址),关注后回复"数据集2024"即可获取。这里特别说明:部分大型数据集只提供下载指引,请遵循原作者的许可协议使用。对于中文实践,THUCNews中文文本分类数据集是更好的选择,包含74万篇新闻文本。欢迎在评论区分享交流!- 葡萄酒分类数

文章图片
#机器学习#分类#回归
免费的机器学习超参数优化,Optuna教程

今天安利一款**完全免费**的超参优化工具——Optuna,只需几行代码就能让模型性能飙升,GitHub狂揽**10k+ Star**,连Kaggle大佬都在偷偷用!最佳参数: {'n_estimators': 217, 'max_depth': 6, 'learning_rate': 0.0087, 'subsample': 0.89}**(完整项目见GitHub:https://github.

文章图片
#机器学习#人工智能
免费的机器学习特征工程工具,Featuretools

1. **自动化特征生成**:FeatureTools能够自动从时间序列、用户日志等复杂数据中提取有效的统计特征和聚合特征。2. **深度特征合成(DFS)**:类似于深度学习中的多层特征抽象,DFS能构建高层次的特征,挖掘数据中深层次的关系。1. **时间窗口特征**:通过设置cutoff_time参数,可以生成特定时间窗口内的特征。4. **可解释性**:虽然自动生成特征,但每项特征的来源都清

文章图片
#机器学习#人工智能
15个实用的数据可视化工具,Python库

作为一名数据分析师,我整理了自己在工作中常用的15个"神兵利器",分享给各位同行。它的pyplot接口特别适合快速绘图,虽然API较为底层复杂,但正是这种"全局掌控感"让专业用户爱不释手。每个工具都有自己的"特长场景",我的工作流通常是:Python库做探索分析→Tableau/Power BI做最终展示→特殊需求用D3.js定制开发。这个库生成的SVG矢量图在任何分辨率下都能保持清晰,非常适合需

文章图片
#信息可视化#python#开发语言
免费的区块链智能合约教程,Solidity实战前言:为什么选择Solidity?

智能合约开发其实没有想象中那么难,关键是要多动手实践。我刚入门时在Remix上把玩了一百多个示例合约才找到感觉。记住:在区块链上部署合约是不可逆的,测试网练手很重要!**下期预告**:《智能合约Gas优化全攻略》——教你如何省下90%的gas费!建议多读开源合约代码,比如Uniswap的合约就非常值得学习。- 值类型:bool, uint, int, address。手把手教你玩转Solidity

文章图片
#区块链#智能合约
免费的大数据可视化工具,Superset教程

昨天摸鱼时发现了一款**完全免费**的数据可视化神器——**Apache Superset**,今天赶紧来安利!**总结**:如果你受够了 Excel 画图,又不想花大钱买商业软件,Superset 绝对值得一试!- **支持 30+ 种数据源**(MySQL/PostgreSQL/Oracle 甚至 CSV 都能导)- **动态筛选器**:在 dashboard 添加【Filter Box】,选

文章图片
#信息可视化
免费的大数据可视化工具,Superset教程

昨天摸鱼时发现了一款**完全免费**的数据可视化神器——**Apache Superset**,今天赶紧来安利!**总结**:如果你受够了 Excel 画图,又不想花大钱买商业软件,Superset 绝对值得一试!- **支持 30+ 种数据源**(MySQL/PostgreSQL/Oracle 甚至 CSV 都能导)- **动态筛选器**:在 dashboard 添加【Filter Box】,选

文章图片
#信息可视化
免费的大数据集群部署,Kubernetes方案

虽然免费方案存在一定性能局限,但通过合理配置和优化,完全能满足开发测试和小规模生产需求。建议使用至少三台配置在4核8G以上的云服务器或物理机,推荐选用各大云厂商提供的免费试用机(如AWS、阿里云等均有1-3个月免费试用期)。1. **弹性伸缩**:配置HPA自动扩缩容,非工作时间缩减副本数节省资源。2. **资源监控**:部署Prometheus+Grafana监控套件。3. **日志收集**:使

文章图片
#大数据#kubernetes#容器
到底了