logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【大数据实战项目一】数据下载以及工具软件的使用

数据下载以及工具软件的使用1 数据从哪里来?数据怎么用?1.1 本项目中使用的数据——飞机航班数据1.2 结构化数据与非结构化数据1.3 结构表的特征提取和呈现1.4 数据分析金字塔1.5 数据下载2 大数据实战项目中工具软件的选择2.1 原始数据收集器使用的技术——Kafka2.2 原始数据存储使用到的技术——HadoopHDFS2.3 原始数据批处理使用到的技术——Spark、PySpark、

#big data#数据挖掘#数据分析
【机器学习】逻辑回归案例二:鸢尾花数据分类,决策边界绘制逐步代码讲解

逻辑回归案例二:鸢尾花数据分类,决策边界绘制逐步代码讲解1 数据加载2 数据EDA3 模型创建及应用3.1 数据切分3.2 创建模型与分类3.3 决策边界绘制3.3.1 二分类决策边界绘制3.3.2 多分类决策边界绘制3.3.3 三维决策平面的绘制手动反爬虫,禁止转载:原博地址 https://blog.csdn.net/lys_828/article/details/121929869(CSDN

文章图片
#机器学习#逻辑回归#分类
【python爬虫专项(10)】去哪儿网景点数据采集

以上海旅游景点数据为例参考网址:上海旅游景点爬虫逻辑:【分页网页url采集】-【数据采集】还是按照爬虫逻辑二进行获取数据函数1:get_urls(city,n) → 【分页网页url采集】       city:城市对应的编码       n:页数参数&n...

#python#数据分析
【Hadoop】谷歌的三篇论文(GFS、MapReduce分布式计算模型 、BigTable大表)

谷歌的三篇论文(GFS、MapReduce分布式计算模型 、BigTable大表)0 谷歌的基本思想:三驾马车1 第一篇论文:GFS1.1 Google的GFS分布式文件系统的基本原理1.2 HDFS1.2.1 节点介绍1.2.2 数据块与机架感知1.2.3 客户端日志1.2.4 数据块位置信息1.2.5 倒排索引2 第二篇论文:MapReduce分布式计算模型2.1MapReduce基本原理2.

#数据库#大数据#hadoop +1
【python实现网络爬虫21】天眼查企业数据获取

天眼查企业数据获取1. 目标网址及爬取要求2. 网页过渡3. 具体数据的获取4. 扩展及全部代码1. 目标网址及爬取要求根据搜索进行相应公司具体信息数据的爬取,第一步是进入天眼查的官网,然后输入公司的名称,然后在返回数据默认评分第一位的公司点击进入后呈现的结果就是要爬取的内容,这里以小米公司为例第一步:打开天眼查网站主页第二步: 输入小米后回车确认,然后滚动条下拉找到匹配的公司第三步,点击进入公司

#python#html#正则表达式 +1
【事故致因】HFACS模型各层级中因素的具体含义及内容归纳

Human Factors Analysis and Classification System (HFACS)是由Scott Shappell博士和Doug Wiegmann博士开发的。这是一个广泛的人为错误框架,最初被美国空军用于调查和分析航空领域的人为因素。HFACS很大程度上基于James Reason的瑞士奶酪模型(Reason 1990)。HFACS框架提供了一个工具,以协助调查过程和

文章图片
#分类
【python实现网络爬虫(14)】python爬取酷狗中多类型音乐步骤详解(附全部源代码)

目标网址:酷狗音乐-赤伶,页面如下爬虫逻辑:【找到要获取特定音乐的url】>>>【找到该资源链接的url】>>>【封装获取音乐的函数】>>>【封装下载音乐的函数】注意:这两个获取url的顺序是和之前获取url的过程是反过来的,以往是获取外部页面的url后进入内部页面的url,然后再获取该页面的信息。但是下载音乐(定向爬取数据),首先...

#python#机器学习#html
很抱歉,三维地图当前不能在你的国家/地区使用 Excel绘制三维地图问题解决

手动反爬虫:原博地址 https://blog.csdn.net/lys_828/article/details/123585838知识梳理不易,请尊重劳动成果,文章仅发布在CSDN网站上,在其他网站看到该博文均属于未经作者授权的恶意爬取信息问题之前在利用Excel进行三维地图绘制的时候,一切顺利,很久一段时间没有使用了。今天再使用这和功能发现提示如下的警告。解决方式其实解决起来也很简单:就是把当

【计算机视觉】图片的加载、查看与保存(OpenCV)

图片的加载、查看与保存1. 准备二级目录三级目录1. 准备进行计算机视觉的处理需要安装相应的第三方库,这里直接安装,cmd下运行如下指令,安装opencv-python 、tensorflow和keras三个库,注意第一个库使用的方式直接为cv2pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-pythonpip inst

#python#opencv#tensorflow +1
【数据分析师-数据分析项目案例一】600w+条短租房数据案例分析

短租房数据案例分析1 前言1.1 数据集1.2 数据分析思路梳理2 数据分析2.1 数据加载2.2 数据查看3数据可视化3.1 每天房屋入住率3.2 房屋月份价格走势3.3 房屋星期价格特征3.4 不同社区的房源数量3.5 房源评分情况3.6 房源价格情况3.7 不同社区与房源价格的关系3.8 品质房和普通房3.8 配套设施和房价的关系3.9 房型和房价的关系3.10 配套设施必备类型3.11 床

#随机森林
    共 18 条
  • 1
  • 2
  • 请选择