logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

《一文搞懂大数据任务调度:批处理与流式调度最佳实践》

数据调度与工作流是大数据平台的核心管理组件,主要分为批处理调度和流式调度两大类。批处理调度(如Airflow/Oozie/Azkaban)适合定时任务和ETL流程,特点为分钟级延迟、依赖驱动;流式调度(如Flink CEP)则实现毫秒级实时处理,适用于风控监控等场景。选型需结合业务需求:批处理选Airflow,实时场景用Flink,混合架构可通过消息队列衔接。调度平台如同"定时班车&qu

#大数据
《一文搞懂数据查询与分析层:SQL、OLAP 与 BI 工具全解析》

数据查询与分析层概述 数据查询与分析层是数据处理流程中的关键环节,主要负责对数据仓库/湖中的数据进行查询、分析和可视化,赋能企业决策。该层包含三大核心组件: SQL查询引擎(Hive/Presto/Trino):支持分布式SQL查询,适用于批量分析和多源联合查询 BI可视化工具(Tableau/Power BI):提供交互式报表和仪表盘构建能力 OLAP引擎(Kylin/ClickHouse):实

#sql#数据库
telnet localhost 44444 telnet: connect to address ::1: Connection refused

1.检查memcached是否安装,且已开启memcached服务rpm -qa memcached 有输出说明已安装如果没有输出则没有安装yum install memcached2.检查telnet 是否安装,且已开启telnet服务rpm -qatelnet 有输出说明已安装如果没有输出则没有安装yum install telnet3.检查telnet-se...

数据数仓的三种建模方式

所谓水无定势,兵无常法。不同的行业,有不同行业的特点,因此,从业务角度看,其相应的数据模型是千差万别的。目前业界较为主流的是数据仓库厂商主要是 IBM 和 NCR,这两家公司的除了能够提供较为强大的数据仓库平台之外,也有各自的针对某个行业的数据模型。例如,在银行业,IBM 有自己的 BDWM(Banking data warehouse model),而 NCR 有自己的 FS-LDM 模型。在电

spark和RDD的知识梳理与总结

什么是Spark基于内存的,用于大规模数据处理(离线计算、实时计算、快速查询(交互式查询))的统一分析引擎。Spark特点快:Spark计算速度是MapReduce计算速度的10-100倍易用:(算法多)MR支持1种计算模型,Spsark支持更多的计算模型。通用:Spark 能够进行离线计算、交互式查询(快速查询)、实时计算、机器学习、图计算等兼容性:...

什么是大数据?

什么是大数据?字面意思理解:大量的数据,海量的数据数据集的大小已经远远超过了现有普通数据库软件和工具的处理能力的数据大数据有什么特点?海量化数据量大(多)多样化结构化数据,半结构化数据,和非结构化数据快速化数据的增长速度快高价值海量数据价值高大数据能做什么?1、海量数据快速查询2、海量数据的存储(数据量大,单个大文件)3、海量数据的...

com.taobao.arthas.agent334.AgentBootstrap

创建索引,能够运行成功,但是报错java.lang.ClassNotFoundException: com.taobao.arthas.agent334.AgentBootstrapat java.net.URLClassLoader.findClass(URLClassLoader.java:381)at java.lang.ClassLoader.loadClass(ClassLoader.j

Docker从入门到精通(二)

测试Helloworld1、启动hello-worlddocker run hello-world2、run干了什么?底层原理Docker是怎么工作的Docker是一个Client-Server结构的系统,Docker守护进程运行在主机上, 然后通过Socket连接从客户端访问,守护进程从客户端接受命令并管理运行在主机上的容器。 容器,是一个运行时环境,就是我们前面说到的集装箱为什么Docker比

#docker
在linux安装redis

Redis 安装前提:找到一个虚拟机这台虚拟机必须连接外网ping www.baidu.com1.上传2.解压3.准备编译c++的环境yum -y install gcc-c++安装tclyum -y install tcl4.进行编译进入安装目录make && make install...

什么是服务器、云服务的优缺点是什么、为什么要使用云服务器?

云服务什么是云服务器?        云服务是基于互联网的相关服务的增加、使用和交互模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云是网络、互联网的一种比喻说法。过去在图中往往用云来表示电信网,后来也用来表示互联网和底层基础设施的抽象。云服务指通过网络以按需、易扩展的方式获得所需服务。这种服务可以是IT

#云服务#云平台
    共 21 条
  • 1
  • 2
  • 3
  • 请选择