logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

电商数据仓库的架构、模型与应用实践

一. 数据仓库概念二. 项目需求及架构设计1. 项目需求分析2.项目框架2.1技术选型2.2 系统数据流程设计2.3 框架版本选型2.4 服务器选型2.5 集群资源规划设计2)测试集群服务器规划服务名称子服务服务器hadoop102服务器...

#数据仓库#大数据
Could not open connection to the HS2 server解决方案

问题如下:Error:Could not open client transport with JDBC Uri: jdbc:hive2://node01:10000/default:java.net.ConnectException refused先输入下面命令,确定metostore能不能启动再确认9083端口有没有启动再确认hive能不能进入shell...

实用 | Dataworks的使用详细说明

一、开通Dataworks(1)百度搜Dataworks,进入如下页面,点击立即开通(2) 这里要选好自己想要的配置,这里展示我之前的配置解决方案:选DataWorks+MaxCompute组合产品DataWorks:标准版购买时长:1年MaxCompute:按量付费(3)开通好之后,进入Dataworks的控制台,点击dataworks首页二、进入dataworks首页三、数据开发(1)点击数据

#大数据#odps
电商数据仓库的架构、模型与应用实践

一. 数据仓库概念二. 项目需求及架构设计1. 项目需求分析2.项目框架2.1技术选型2.2 系统数据流程设计2.3 框架版本选型2.4 服务器选型2.5 集群资源规划设计2)测试集群服务器规划服务名称子服务服务器hadoop102服务器...

#数据仓库#大数据
实用 | 数据挖掘的十大算法

为了进行数据挖掘任务,数据科学家们提出了各种模型,在众多的数据挖掘模型中,国际权威的学术组织 ICDM (the IEEE International Conference on Data Mining)评选出了十大经典的算法。按照不同的目的,我可以将这些算法分成四类,以便你更好的理解。l 分类算法:C4.5,朴素贝叶斯(Naive Bayes),SVM,KNN,Adaboost,CARTl 聚类

#大数据#算法
Druid数据库连接池的使用(非常实用!!!)

Druid数据库连接池的使用一、Druid_基本使用Druid:数据库连接池实现技术,由阿里巴巴提供的步骤:1. 导入jar包 druid-1.0.9.jar* 不要忘记导入数据库驱动jar包2. 定义配置文件:* 是properties形式的* 可以叫任意名称,可以放在任意目录下,推荐放在src目录下3. 加载配置文件用Properties类的load...

DBeaver连接不上clickhouse

一、问题描述打开dbeaver,出现can‘t load driver ru.yandex.clickhouse.ClickHouseDriver二、百度找到jar包的坐标我去github 找到了这个坐标三、配置驱动右键点击某个clickhouse连接 ,点编辑连接 ,点编辑驱动设置,再点添加工件点击确定后,点测试链接,完美连接,弹出下载页后,下载对应的驱动,可以尽情玩CK啦!!!!!TIP:最好

#大数据#clickhouse
kafka的架构图

一、官方文档架构图:二、kafka四大核心1、生产者API允许应用程序发布记录流至一个或者多个kafka的主题(topics)。2、消费者API允许应用程序订阅一个或者多个主题,并处理这些主题接收到的记录流。3、StreamsAPI允许应用程序充当流处理器(streamprocessor),从一个或者多个主题获取输入流,并生产一个输出流到一个或者多个主题,能够有...

到底了