logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

[impala]cloudera-scm-server dead but pid file exists问题解决

用impala做实验遇到了cloudera-scm-server dead but pid file exists问题。问题发生的经过是这样的:首先我在单机配置的为2核4GB内存的5台虚拟机上安装了cloudera manager,然后用它安装了cdh和impala然后一切都是正常的,我就往集群的hdfs里面导入了100GB的数据然后一切仍然是正常的,可是突然有一天,clouder

hama学习笔记(1)-配置和启动hama

Apache Hame是Google Pregel的开源实现,与Hadoop适合于分布式大数据处理不同,Hama主要用于分布式的矩阵、graph、网络算法的计算。简单说,Hama是在HDFS上实现的BSP(Bulk Synchronous Parallel)计算框架,弥补Hadoop在计算能力上的不足。关于bsp计算模型:http://ieeexplore.ieee.org/xpls/

在OpenStack虚拟机实例中创建swap分区的一种方法

测试组里一个同学负责MapR的搭建,MapR文档中建议每个节点上至少有24GB的swap分区,不知道MapR为啥会有这种反人类的建议……swap无非就是一块顺序读写的磁盘空间,莫非省着内存不用,用swap能提高效率?也许它用swap来存map-reduce的临时文件?可是既然这么建议了,只好照办,毕竟我们对MapR也不熟悉。要让OpenStack的实例中有swap分区,可以在镜像中加,但是

Redis批量导入数据

环境:openstack上的一个8核CPU、16GB内存、110GB磁盘的虚拟机ubuntu12.04 x64 server系统安装redis2.6.7过程:做实验的时候需要把一个2.1亿条的key-value数据导入redis以提供快速的查询。安装、配置、启动redis之后,需要把数据导入到redis中。尝试用jedis写客户端往redis中逐条插入数据的话,速度很慢

为OpenStack制作CentOS镜像的一种方法

Ubuntu和Fedora都有官方的系统镜像,偏偏CentOS没有,网上能找到一些也都不甚靠谱,加之在我们自己的项目中有一些需要自己定制的东西,所以还是自己做镜像比较合适。为OpenStack制作CentOS系统镜像,官方的在线文档以及网上很多资料中给出了一种方法,即利用virt-install或者kvm创建虚拟机之后通过vnc安装系统、配置系统参数,最后上传到OpenStack中,参考:

[impala]cloudera-scm-server dead but pid file exists问题解决

用impala做实验遇到了cloudera-scm-server dead but pid file exists问题。问题发生的经过是这样的:首先我在单机配置的为2核4GB内存的5台虚拟机上安装了cloudera manager,然后用它安装了cdh和impala然后一切都是正常的,我就往集群的hdfs里面导入了100GB的数据然后一切仍然是正常的,可是突然有一天,clouder

Dr.com环境下VMware虚拟机和主机共享上网方法

环境学校里上网使用的是Dr.com客户端在VMware中安装了Linux虚拟机,作为学习用的服务器主机上装的是win7,有一块有线网卡和一块无限网卡,虚拟机上没有设置无限网络(服务器一般也不需要无线网络)需求需要用putty客户端通过ssh连接linux虚拟机,通过ftp向linux上传文件win7连接linux同时还需要上网查资料方法1通过路由器:之前用一个D

#linux#网络#虚拟机
linux 根据进程名查看其占用的端口

有时候需要查看一个进程占用了那个端口,但是只知道进程大致的名称,比如要查看hadoop的namenode在哪个端口上运行,以便在eclipse中连接。一种方法如下,可能比较搓,请大牛指教!首先用ps命令查看进程的id:$ ps -ef | grep Name其中每一行(很长的时候会占用若干行)的第二个字段就是进程的id。当然,对于在java虚拟机中运行的进程,比如hadoo

#eclipse#hadoop#linux +1
到底了