logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

爬虫笔记三

爬虫笔记三–第二关首先补我上一篇:爬虫笔记三的一点内容识了HTML中的常见标签和常见属性:即通过调用requests库,获取到了网页源代码:import requests #调用requests库res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.ht

文章图片
#大数据#爬虫#python
第一章 Hadoop体系介绍

Hadoop快速入门1:Hadoop简介Hadoop 是 Apache 软件基金会旗下的一个开源的分布式计算平台。Hadoop 提供的功能:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理; “处理”什么问题?  海量数据的存储和海量数据的分析计算问题。也就是 Hadoop 的两大核心:HDFS 和 MapReduce。Hadoop 的核心组件有:Common(基础组件):(工具

#hadoop#大数据
暂无文章信息