
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
顺利注册完kaggle之后,我们终于可以开始上手撸项目啦!我们就先从大名鼎鼎的泰坦尼克号开始!尽管网上有很多大神进行了“入门级别”的代码分享讲解,但我看了一轮下来,自惭形秽,深深觉得我还不配称为入门级别的选手,我只是个小白……所以这篇文章还有个副标题是“小白级别“的代码分享o(*≧▽≦)ツ。声明在前:我的代码有参考某些大神的帖子,在文末会贴上作者及链接;我的代码和文章仅做学习研究分享,如...
AHP权重计算方法案例1.案例背景公司要对网站用户行为进行追踪,以优化推荐系统算法,需要对已有的5项行为指标(为便于理解,此处展示5项)分配对应权重,需要我们数据部门给出权重建议。当然不能拍脑门……我以AHP层次分析法为理论基础设计了一套权重计算方案2.理论背景AHP层次分析法,简言之,利用数字大小相对性,数字越大越重要,权重越高,计算每个因素的重要性。AHP源于上世纪70年代初美国国防部研究课题
此文主要分享文本数据的拆分,提取合并,为下一步可视化分析做好准备。数据来源于boss与拉勾网数据分析岗位的招聘信息。拉勾网的爬取方法见此文:《Python selenium+beautifulsoup 登录爬取拉勾网》环境配置# Jupyter Notebook%matplotlib inlineimport pandas as pdimport warningsw...
如题,本帖主要详述SQLServer导入csv的步骤,以及遇到报错问题。正在执行 (错误)消息•错误 0xc02020a1: 数据流任务 1: 数据转换失败。列“列 1”的数据转换返回状态值 4 和状态文本“文本被截断,或者一个或多个字符在目标代码页中没有匹配项。”。(SQL Server 导入和导出向导)•错误 0xc020902a: 数据流任务 1: “输出列“列 1”(14...







