logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据平台之Hadoop复习详细知识点

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统( Distributed File System),其中一个组件是HDFS(Hadoop Distributed File System)。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-c

#hadoop#大数据#hdfs
【Python数据可视化】使用geoplotlib绘制地理空间数据

❤️❤️需要数据集的可以评论。Geoplotlib 是地理空间数据可视化的开源Python库,包含了大量的地理空间可视化操作,并且支持硬件加速。提示:以下是本篇文章正文内容,下面案例可供参考主要问题是在安装geoplotlib,其余就是简单导入数据画图。

#信息可视化#python#数据分析
使用 TF-IDF 算法将文本向量化

TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF是词频(Term Frequency),IDF是逆文本频率指数(Inverse Document Frequency)。提示:以下是本篇文章正文内容,下面案例可供参考TF-IDF算法介绍及实现TF-IDF算法详解百度百科——tf-idf。

#算法#人工智能
超级简单,四步带你入门爬虫,爬取图片

四步带你入门爬虫,爬取图片本人还是学生,python小白。其实很多基础还不牢固,但是对爬虫比较有兴趣,在这里也希望能帮助大家入门爬虫,毕竟还是比较有趣。需要一些html基础,不过这个html也很简单。完整代码块import requestsfrom lxml import etreeimport osif __name__ == '__main__':url = 'https://pic.netb

#python#html
到底了