logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

新手该如何学习前端开发技术

现在有很多小伙伴选择学习web前端开发技术,但是小伙伴在选择web前端培训班学习之前有没有考虑过一个问题,自己选择学习前端开发的初衷是什么,为什么要学习web前端开发技术,是单纯的兴趣爱好还是以就业为目的的技术提升。小伙伴要考虑清楚这些问题,确定自己的学习目标,在学习过程中才会有动力。小伙伴在学习web前端开发技术过程中,不仅需要端正的学习态度,还需要明确的学习思路和适合自己的学习方法,尤其是零基

文章图片
大数据开发技术之如何将数据导入到HBase

在实际生产环境中,将计算和存储进行分离,是我们提高集群吞吐量、确保集群规模水平可扩展的主要方法之一,并且通过集群的扩容、性能的优化,确保在数据大幅增长时,存储不能称为系统的瓶颈。大数据培训具体到我们实际的项目需求中,有一个典型的场景,通常会将Hive中的部分数据,比如热数据,存入到HBase中,进行冷热分离处理。我们采用Spark读取Hive表数据存入HBase中,这里主要有两种方式:通过HBas

文章图片
#hbase#spark#big data
大数据开发之HBase异常问题分析

1. 问题现象和原因概述1) 网卡打满导致请求响应缓慢:通过查看问题发生时段集群服务器的网络流量情况,发现大量的RegionServer所在的服务器出现了网卡打满现象。随着大数据业务的快速发展,Hadoop集群所面临的数据读写压力也在不断增长,千兆网卡在应对大批量的数据通信请求时容易被打满,这种​​大数据培训​​情况下就会大大影响数据的传输速度,进而产生请求响应缓慢的问题。2) RegionSer

文章图片
#mysql#数据库#nosql
大数据开发之Hive-DML数据操作

1. 数据导入1.1 向表中装载数据(Load)1)语法hive> load data [local] inpath ‘/opt/module/datas/student.txt’ [overwrite] into table student [partition (partcol1=val1,…)];(1)load data:表示加载数据(2)local:表示从本地加载数据到hive表;否

文章图片
大数据开发之通过 Spark 来扩展 Presto

概述Presto 最初设计是对数据仓库中的数据运行交互式查询,但现在它已经发展成为一个位于开放数据湖分析之上的统一 SQL 引擎,用于交互式和批处理工作负载,数据湖上的流行工作负载包括:•报告和仪表盘:这包括为内部和外部开发人员提供自定义报告以获取业务洞察力,以及许多使用 Presto 进行交互式 A/B 测试分析的组织。这个用例的典型特征是要求低延迟。它在非常高的 QPS 下需要数十到数百毫秒,

文章图片
#big data#spark#数据仓库
大数据培训:Flink全链路延迟的测量方式及原理

一、背景Flink Job端到端延迟是一个重要的指标,用来衡量Flink任务的整体性能和响应延迟(大部分流式应用,要求低延迟特性)。通过流处理引擎竞品对比,我们发现大部分流计算引擎产品,都在告警监控页面,集成了全链路时延指标展示(直方图)。一些低延时的处理场景,例如用于登陆、用户下单规则检测,实时预测场景,需要一个可度量的Metric指标,来实时观测、监控集群全链路时延情况。二、源码分析来源1、本

文章图片
#big data#flink#大数据
大数据开发技术之Partition分区的分析

Shuffle机制Map方法之后,Reduce方法之前的数据处理过程称之为Shuffle。如图4-14所示。图4-14 Shuffle机制Partition分区Partition分区案例实操1.需求将统计结果按照手机归属地不同省份输出到不同文件中(分区)(1)输入数据(2)期望输出数据手机号136、137、138、139开头都分别放到一个独立的4个文件中,其他开头地放到一个文件中。2.需求分析3.

文章图片
大数据开发之Hive-DML数据操作

1. 数据导入1.1 向表中装载数据(Load)1)语法hive> load data [local] inpath ‘/opt/module/datas/student.txt’ [overwrite] into table student [partition (partcol1=val1,…)];(1)load data:表示加载数据(2)local:表示从本地加载数据到hive表;否

文章图片
大数据开发之运维面试题汇总分享

Q1:集群线上扩容如何达到自动化?线上扩容,规模正常都是以 10+以上,如果都以课堂所示,人肉操作,时间投入与产出比不匹配,人力造成很大的不必要浪费,想学习老师线上集群实际扩容的方案。A:课堂所示兼顾了小白同学,所以是手把手纯人肉搭建,产线环境扩容数量少则几十多则上百,人肉肯定不行,我们公司的运维分为 IAAS 运维、大数据运维、应用运维,大数据运维工程师在扩容集群时,需要向 IAAS 运维工程师

文章图片
#运维#big data#大数据
大数据开发技术之Linux常用运维命令分享

cat命令:参数:-n 或 --number 由 1 开始对所有输出的行数编号-b 或 --number-nonblank 和 -n 相似,只不过对于空白行不编号-s 或 --squeeze-blank 当遇到有连续两行以上的空白行,就代换为一行的空白行-v 或 --show-nonprinting-E --show-ends 在每行结束处显示 $-e --等价于-vEcat主要有三大功能:1.

文章图片
#linux#运维#vim
    共 81 条
  • 1
  • 2
  • 3
  • 9
  • 请选择