
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
我们做数据分析,在第一次拿到数据集的时候,一般会用统计学或可视化方法来了解原始数据。了解列数、行数、取值分布、缺失值、列之间的相关关系等等,这个过程叫做 (Exploratory Data Analysis,探索性数据分析)。如果你现在做还在用一行行写代码,那么福音来了!目前已经有很多工具可以自动产出基础的统计数据和图表,能为我们节省大量时间。本文会对比介绍 4 款常用的工具,最后一款绝了,完全是

正所谓:有朋自远方来,不亦乐乎?有朋友来找我们玩,是一件很快乐的事情,那么我们要尽地主之谊,好好带朋友去玩耍!那么问题来了,什么时候去哪里玩最好呢,哪里玩的地方最多呢?今天将手把手教你使用线程池爬取同程旅行的景点信息及评论数据并做词云、数据可视化!!!带你了解各个城市的游玩景点信息。在开始爬取数据之前,我们首先来了解一下线程。进程:进程是代码在数据集合上的一次运行活动,是系统进行资源分配和调度的基

导读:Python中常会用到一些专门的库,如NumPy、SciPy、Pandas和Matplotlib。数据处理常用到NumPy、SciPy和Pandas,数据分析常用到Pandas和Scikit-Learn,数据可视化常用到Matplotlib,而对大规模数据进行分布式挖掘时则可以使用Pyspark来调用Spark集群的资源。从一定程度上来说,学习Python数据分析主要就是学习使用这些分析库。

如今Python爬虫越来越火,有想学好Python爬虫的小伙伴可以前往gzh【Python编程学习圈】领取系统的学习资料以及教程视频,还分享有大量的技术干货文章可以阅读学习,欢迎大家关注学习。传统的抓包工具,如:Fiddler、Charles、Wireshark、Tcpdump,大家肯定都不陌生了;今天我们就来聊一聊这款常用的抓包工具:Fiddler;fiddler简介Fiddler是个蛮好用的抓

正所谓:有朋自远方来,不亦乐乎?有朋友来找我们玩,是一件很快乐的事情,那么我们要尽地主之谊,好好带朋友去玩耍!那么问题来了,什么时候去哪里玩最好呢,哪里玩的地方最多呢?今天将手把手教你使用线程池爬取同程旅行的景点信息及评论数据并做词云、数据可视化!!!带你了解各个城市的游玩景点信息。在开始爬取数据之前,我们首先来了解一下线程。进程:进程是代码在数据集合上的一次运行活动,是系统进行资源分配和调度的基

导读:Python中常会用到一些专门的库,如NumPy、SciPy、Pandas和Matplotlib。数据处理常用到NumPy、SciPy和Pandas,数据分析常用到Pandas和Scikit-Learn,数据可视化常用到Matplotlib,而对大规模数据进行分布式挖掘时则可以使用Pyspark来调用Spark集群的资源。从一定程度上来说,学习Python数据分析主要就是学习使用这些分析库。

在日常开发工作中,经常会遇到这样的一个问题:要对数据中的某个字段进行匹配,但这个字段有可能会有微小的差异。比如同样是招聘岗位的数据,里面省份一栏有的写“广西”,有的写“广西壮族自治区”,甚至还有写“广西省”……为此不得不增加许多代码来处理这些情况。今天跟大家分享FuzzyWuzzy一个简单易用的模糊字符串匹配工具包。让你轻松解决烦恼的匹配问题!1. 前言在处理数据的过程中,难免会遇到下面类似的场景

今天给大家分享一个综合了数据采集、处理、分析、可视化、接口调用等技术点的项目。一、说点东西老早就想搞个基金监控机器人了,方便自己查看自己关注基金的各种指数涨跌情况,及时进行止损或者止盈,今天我们先建楼基,手把手带大家实现一个基金查询机器人,目前主要可以查询基金指定日期段数据和查看基金净值走势图,后面慢慢新增功能。二、开始动手动脑2.1 环境准备Linux、Mac、Windows 都可以python

简要说明最近两天需要做一个python的小程序, 就是实现人与智能机器人(智能对话接口)的对话功能,目前刚刚测试了一下可以实现, 就是能够实现个人与机器的智能对话(语音交流)。总体的思路大家可以设想一下, 如果要实现人与机器的智能对话, 肯定要有以下几个步骤:计算机接收用户的语音输入将用户输入的语音输入转化为文本信息调用智能对话接口, 发送请求文本信息, 获取接口返回的智能回答文本信息将回答文本信








