logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

hadoop学习笔记之hadoop伪分布集群搭建(二)

本次hadoop伪分布搭建环境:Windows10_64位+VMware9.0+Centos 6.4(32位)默认以上环境已经配置好,下面开始进行hadoop伪分布集群安装......============================================================内容如下:一、给主机服务器(Centos 6.4)配

#hadoop#集群
spark SQL读取ORC文件从Driver启动到开始执行Task(或stage)间隔时间太长(计算Partition时间太长)且产出orc单个文件中stripe个数太多问题解决方案

具体请参考:https://blog.csdn.net/aijiudu/article/details/78616064补充:如果以上方式并不能大幅缩短时间,可确认下是否ORC文件个数过多,如果太多的话建议通过合并处理减少ORC文件个数,这样能大幅减少等待时间(可能跟spark读取ORC头文件信息有关,如果个数太多,时间肯定会长)...

#spark
Centos 7(linux)系统下如何创建软件桌面快捷方式

刚接触Linux系统,通过解压安装的应用程序每次启动的时候都是cd到相应的bin目录下,然后执行相应的.sh文件,相当的麻烦,如何才能像Windows一样创建桌面快捷方式呢?下面就让我们开始吧!1、创建系统自带的应用程序快捷方式对于系统自带的应用程序,其桌面快捷方式存储的位置为以下三个目录中的其中一个:/usr/share/applications~/.local/share/applicatio

模仿mnist数据集制作自己的数据集

模仿mnist数据集制作自己的数据集最近看深度学习,用TensorFlow跑教程里的模型,发现教程里大多都是用mnist和cifar这两个数据集来演示的。想测试自己的数据集看看初步效果,于是就想套用现有的模型,将自己的数据集做成和mnist或cifar数据集格式一模一样的格式。然后就发现Tensorflow里没有现成的方法可以将图片转换成类似于mnist和cifar数据集格式的方法。于是就百度

StreamSets 下载安装教程

本教程以 StreamSet 3.4.0 为例StreamSet有多种安装方式,最简单的一种就是下载压缩包,直接解压即可使用 1、下载StringSet压缩包StringSet下载地址:https://streamsets.com/opensource/执行以下语句$ tar xvzf streamsets-datacollector-core-3.4.0...

C++ 求最短路径问题之Dijkstra算法(一)

求最短路径之Dijkstra算法Dijkstra算法是用来求单源最短路径问题,即给定图G和起点s,通过算法得到s到达其他每个顶点的最短距离。基本思想:对图G(V,E)设置集合S,存放已被访问的顶点,然后每次从集合V-S中选择与起点s的最短距离最小的一个顶点(记为u),访问并加入集合S。之后,令u为中介点,优化起点s与所有从u能够到达的顶点v之间的最短距离。这样的操作执行n次(n为顶点个数)

到底了