
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
大数据是对海量数据进行存储、计算、统计、分析处理的一系列处理手段,处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据处理手段所无法完成的,其涉及的技术有分布式计算、高并发处理、高可用处理、集群、实时性计算等,汇集了当前IT领域热门流行的IT技术。想要学好大数据需掌握以下技术:1. Java编程技术Java编程技术是大数据学习的基础,Java是一种强类型语言,拥有...
一. 数据仓库概念二. 项目需求及架构设计1. 项目需求分析2.项目框架2.1技术选型2.2 系统数据流程设计2.3 框架版本选型2.4 服务器选型2.5 集群资源规划设计2)测试集群服务器规划服务名称子服务服务器hadoop102服务器...
问题如下:Error:Could not open client transport with JDBC Uri: jdbc:hive2://node01:10000/default:java.net.ConnectException refused先输入下面命令,确定metostore能不能启动再确认9083端口有没有启动再确认hive能不能进入shell...
一、开通Dataworks(1)百度搜Dataworks,进入如下页面,点击立即开通(2) 这里要选好自己想要的配置,这里展示我之前的配置解决方案:选DataWorks+MaxCompute组合产品DataWorks:标准版购买时长:1年MaxCompute:按量付费(3)开通好之后,进入Dataworks的控制台,点击dataworks首页二、进入dataworks首页三、数据开发(1)点击数据
一、官方文档架构图:二、kafka四大核心1、生产者API允许应用程序发布记录流至一个或者多个kafka的主题(topics)。2、消费者API允许应用程序订阅一个或者多个主题,并处理这些主题接收到的记录流。3、StreamsAPI允许应用程序充当流处理器(streamprocessor),从一个或者多个主题获取输入流,并生产一个输出流到一个或者多个主题,能够有...







