By_MoS 个人主页

@qq_21853321

By_MoS

2022-11-18 16:51:05 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

传统数据与大数据的区别

传统数据与大数据的对比传统Linux系统与大数据linux系统安装的区别传统数据1.系统硬盘（与数据硬盘100%隔离）1）两块硬盘做一个RAID12）引导分区： 200M3）交换分区：内存的两倍空间4）根分区： /（剩下所有的空间）2.数据硬盘1）多个硬盘制作一个逻辑卷，即将多个物理磁盘制作成一个大的逻辑硬盘大数据1.系统硬盘1）两块硬盘做一个RAID12）引导分区： 200M3）交换分区：可以

#大数据

大数据的特点和快的原因

大数据的特点和快的原因数据集主要特点其他特征大数据技术快的原因数据集主要特点Volume（大量）:数据量巨大，从TB到PB级别。Velocity（高速）:数据量在持续增加(两位数的年增长率)。Variety（多样）:数据类型复杂，超过80%的数据是非结构化的。Value（低密度高价值）:低成本创造高价值。其他特征数据来自大量源，需要做相关性分析。需要实时或者准实时的流式采集，有些应用90%写vs.

#大数据

Hadoop集群安装部署

前期准备1. 创建三台虚拟机2. 服务器主机名和IP配置（三台）3. 修改每个主机的/etc/hosts文件，添加IP和主机名的对应关系（三台）4. 管理节点到从节点配置无密码登录5. 配置jdk1.8（三台）6. 关闭防火墙（三台）（永久关闭）7. 关闭selinux（三台）vi/etc/selinux/configSELINUX=enforcing-->SELINUX=disabled重

#hadoop

查询课程编号为01且课程成绩在80分以上的学生的学号和姓名

建表语句点击详见– 查询课程编号为01且课程成绩在80分以上的学生的学号和姓名SELECTst.s_id,st.s_name,sc.s_scoreFROM student stINNER JOIN score sc ON sc.s_id=st.s_id AND sc.c_id="01" AND sc.s_score>=80

#数据库

查询各科成绩最高分、最低分和平均分

建表语句点击详见– 以如下形式显示：课程ID，课程name，最高分，最低分，平均分，及格率，中等率，优良率，优秀率– 及格为>=60，中等为：70-80，优良为：80-90，优秀为：>=90SELECTc.c_id,c.c_name,MAX(sc.s_score) "最高分",MIN(sc.s_score) "最低分",AVG(sc.s_score) "平均分" ,((SELECT C

#数据库

统计各科成绩各分数段人数：课程编号,课程名称,[100-85],[85-70],[70-60],[0-60]及所占百分比

建表语句点击详见– 统计各科成绩各分数段人数：课程编号,课程名称,[100-85],[85-70],[70-60],[0-60]及所占百分比SELECT c.c_id,c.c_name,((SELECT COUNT(1) FROM score sc WHERE sc.c_id=c.c_id AND sc.s_score<=100 AND sc.s_score>80)/(SELECT C

#数据库

到底了