Linux基本命令

多数命令都可以在网上查到用法,只简单提下我常用的
.表示当前目录;
cd进入用户主目录;mkdir建立新目录;
cat由第一行开始显示档案内容;
pwd命令用作显示工作目录的路径名称;
ll显示详细信息;ls显示文件;
wc -l *统计当前目录下的所有文件行数;
复制:cp 源文件(夹) 新文件(夹);
剪切/粘贴:mv 源文件(夹) 新文件(夹);
vim进入编辑器,基本操作主要理解为:在刚进入时为正常模式,按Insert/i键进入插入模式,即可通过移动光标进行正常插入,按Esc键进入正常模式,输入:q!命令会不保存退出,输入:wq命令就是保存退出。其他一些复杂用法我暂时还没用上。具体教程在命令行下输入vimtutor或者vimtutor zh_CN就可以看到操作文档。

Windows下极好用的两个工具是Xshell 5和FileZilla,前者用于命令行操作,后者用于文件的传输。

hadoop基本使用命令:

(公司里是这样操作的,没有试过hdfs的那种)
1. 查看指定目录下内容: hadoop fs –ls [文件目录]
2. 打开某个已存在文件:hadoop fs –cat [file_path]
3. 将hadoop上某个文件down至本地已有目录下:hadoop fs -get [文件目录] [本地目录]
4. 删除hadoop上指定文件夹(包含子目录等):hadoop fs –rm [目录地址]
5. 将本地文件(夹)存储至hadoop:hadoop fs –put [本地路径] [hadoop目录]
6. 显示文件的内容,当文件为文本文件时,等同于cat,文件为压缩格式(gzip以及hadoop的二进制序列文件格式)时,会先解压缩:hadoop fs –text PATH
7. 查看某个如[ls]命令的帮助文档 :hadoop fs –help ls

Scala的一点小操作:

rdd.map(_.replaceAll(“要过滤的单词”, “要替换的单词”)),把字符串中要过滤的单词替换为要替换的单词, 要替换的单词可以为空字符串。
rdd.filter(!_.contains(“要过滤的单词”)), 将包含要过滤的单词的字符串去掉。

其他

问题:Permission denied
解决办法:ls -al查看权限详情,权限不够用“chmod 777 文件夹/文件”开放所有权限。

hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行;
jps显示当前所有java进程pid的命令;
free显示系统使用和空闲的内存情况;

Logo

更多推荐