logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Spark-机器学习(1)什么是机器学习与MLlib算法库的认识

从这一系列开始,我会带着大家一起了解我们的机器学习,了解我们spark机器学习中的MLIib算法库,知道它大概的模型,熟悉并认识它。同时,本篇文章为个人spark免费专栏的系列文章,有兴趣的可以收藏关注一下,谢谢。同时,希望我的文章能帮助到每一个正在学习的你们。也欢迎大家来我的文章下交流讨论,共同进步。

文章图片
#spark#scala#大数据 +2
数据可视化-安装 Visual Studio Code (配图保姆级)

特点:VS Code是一个轻量级的源代码编辑器,其主要功能并不是渲染可视化,但强在插件众多,安装方便,使用简洁。特点:Jupyter是一个基于Web的交互式计算环境,可以直接在浏览器里编辑代码,可以实现分布操作,提供了丰富的数据可视化库和工具,但功能较单一。Eclipse是一个集成开发环境,支持以java为主的多种语言,其本身也不支持数据可视化功能,需要安装插件,但插件安装复杂,胜在内置环境运行。

文章图片
#vscode#ide#编辑器
Linux-一篇文章,速通Hadoop集群之伪分布式,完全分布式,高可用搭建(附zookeeper,jdk介绍与安装)。

本片文章会详细介绍hadoop的作用,历史,学习hadoop。以及教会大家如何在Linux搭建hadoop的三种集群,以应对不同场所不同需求的集群环境。除此之外,也可以在本文里一起探讨交流,提升能力。

文章图片
#分布式#linux#hadoop +2
暂无文章信息