
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
某天,阿里九九的产品经理发现最近新用户的留存比较差,找到数据分析师小王:小王啊,最近新用户的留存比较差,你能帮忙分析一下原因不?如果是你,你会怎么做?01我见过的数据分析师一般有这几种处理...
个人介绍大家好,我是一名双非学校、本硕连读的统计学专业毕业生,现就职于一家互联网公司。今天我与大家分享一下我的 “数据分析” 学习之路和收藏的学习资料,希望大家看以后能有所收获。其实,我...
文末赠书14年前,“数学之美”系列文章首载于谷歌黑板报,即获得上百万次点击,凡阅文者,皆叹相见恨晚,大学时痛恨万分的马尔可夫链、矩阵计算,甚至余弦函数等原来如此亲切,自然语言和信息处理怎么这么有趣。14年后,从系列博客到一本屡获大奖的畅销书,《数学之美》已累计销售70余万册,豆瓣评分8.9,还一举拿下国家图书馆文津奖、中华优秀出版物提名奖等国家级图书大奖。李开复评价《数学之美》:“是给这个社会和年
链接:https://urlify.cn/nqaQVfNo.1前言由于本人在这段时候,看到了一个叫做树莓派的东东,初步了解之后觉得很有意思,于是想把整个过程记录下来。No.2树莓派是什么...
来源:Python实用宝典在做NLP(自然语言处理)相关任务时,经常会遇到需要识别并提取省、城市、行政区的需求。虽然我们自己通过关键词表一个个查找也能实现提取目的,但是需要先搜集省市区关键词表,相对而言比较繁琐。今天给大家介绍一个模块,你只需要把字符串传递给这个模块,他就能给你返回这个字符串内的省、市、区关键词,并能给你在图片上标注起来,它就是 Cpca 模块。1.准备开...
点击上方“Python数据之道”,选择“星标公众号”收藏文章的同时,不要忘记「在看」作者|AlfredWu来源 |Alfred数据室6月17日,宜宾长宁发生6.0级...
来源:菜J学Python一、背景也许你还记得,前不久复旦大学一博士生写了130行Python代码,批量识别核酸截图内容的故事。当时还被人民日报公众号报道出来,夸赞用所学贡献青春力量!其实,批量文字识别(OCR)是Python办公自动化的基本操作,应用在我们工作生活中的方方面面,比如车牌识别、证件识别、银行卡识别、票据识别等等。Python中OCR第三方库非常多,比如eas...
在降维过程中,我们会减少特征的数量,这意味着删除数据,数据量变少则表示模型可以获取的信息会变少,模型的表现可能会因此受影响。同时,在高维数据中,必然有一些特征是不带有有效的信息的(比如噪音),或者有一些特征带有的信息和其他一些特征是重复的(比如一些特征可能会线性相关)。我们希望能够找出一种办法来帮助我们衡量特征上所带的信息量,让我们在降维的过程中,能够即减少特征的数量,又...
来源:数据STUDIO本文中,作者硬核总结了十多种时间序列数据分析和预测工具和python库,在我们处理时间序列项目时,可以翻开本文,根据需要选择合适的工具,将会事半功倍!在处理时间序列项目时,数据科学家或 ML 工程师通常会使用特定的工具和库。或者他们使用一些众所周知的工具,而这些工具已被证明可以很好地适用与对应的时间序列项目。如果能将这些工具汇总,在以后的项目中将会很...
之前给大家介绍过几个可以使用 Python 进行数据可视化的库,那么如何将具体想要的数据进行可视化呢,比如股票数据啥的。关于股票数据,网上已经有相对成熟的接口了,我们可以直接调用接口来获...