
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
最近居家太无聊了,无意见逛到了AI社区,发现最近AI算法热度还是很高,什么AI绘画,还有什么AI作诗,写歌。可以说,人工智能领域在一步步挑战人类的高度,从循规蹈矩的简单工作,到高难度的智慧挑战,现在已经在挑战人类最后防线—思想,创作!不过我还是觉得人工智能的路还很遥远!
前言现在神经网络的运用越来越流行了,即使在结构化数据领域神经网络也随着数据量的增大而逐渐替代传统机器学习方法,能够创建一个基础的深度神经网络解决问题对一个合格的算法工程师来说变得越来越关键了。我就从一个初学者的角度出发,对我们常见的回归问题运用神经网络对和集成学习大杀器XGBoost进行预测效果对比。气温数据集下载地址:https://pan.baidu.com/s/1KNYfb2S7ct4KsI
前言比赛地址链接由于本次为基础赛,所以分为正式赛和长期赛,正式赛时间由于和另外重量级比赛冲突,所以做的大佬很少,本人有幸通过自己写的baseline冲到了Rank10,其实代码很少,也简单,也没有做特征,只是做的人少了普遍分都比较低,这篇博客的主要目的是给初学者一个参考,后面可以加很多特征提高,由此分享一下baseline及心得此次天池金融风控赛数据量比较小,训练集提供了80万数据,测试集有20万
前言最近在做OCR相关的任务,用到了阿里天池一个街景字符识别比赛的数据集,索性就分享一下相关方案,我采用YOLO5模型,最终在平台提交分数也做到了0.924,没有经过任何优化,可以看出YOLO5的效果还是非常不错的。比赛地址链接:https://tianchi.aliyun.com/competition/entrance/531795/introduction?spm=5176.12281973
简单数据可视化最近有不少人私信问我数据可视化的图怎么画的?让我开源一下代码。这里我就简单演示一些最基础在数据挖掘过程中用得最多的几个数据可视化方法,希望可以帮助更多的人。说明:可视化数据集采用前面民宿预测项目的数据集!1.对数据集进行缺失值统计:plt.figure(figsize=(10, 10))missing = train.isnull().sum()/len(train)missing
前言数据挖掘中我们经常会遇到高维数据,特别是当我们的特征工程做得比较复杂时,这些特征可能会让我们的模型过拟合,或者很多特征是没有意义,对模型的优化起不到作用,反而会降低模型的运行效率和精度,所以我们需要对我们的特征变量进行筛选,去除掉无意义的特征,尽可能保留少而强的特征。下面是我用得最多的几个方法,也是我个人觉得最实用方法,其他特征筛选方法大家可以自行查阅资料,这里不多介绍。方差选择卡方检验相关系
混淆矩阵什么是混淆矩阵(Confusion Matrix)?我们在做分类问题时会用到机器学习分类模型,不管是二分类还是多分类问题,我们都要对模型的性能进行评估,看看模型的分类效果是否好,有多好!我们常常会选择一个合适的评估指标进行衡量,比如我们熟悉的ACC,AUC,F1-score,召回率等等,而混淆矩阵也是和它们一样的功能,混淆矩阵可以直观的展示我们分类器对每个样本的分类情况,知道有哪些类别分正