logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据再出发-21ClickHouse

ClickHouse 是俄罗斯的 Yandex 于 2016 年开源的列式存储数据库(DBMS),使用 C++语言编写,主要用于在线分析处理查询(OLAP),能够使用 SQL 查询实时生成分析数据报告以下面的表为例:1)采用行式存储时,数据在磁盘上的组织结构为:好处是想查某个人所有的属性时,可以通过一次磁盘查找加顺序读取就可以。但是当想查所有人的年龄时,需要不停的查找,或者全表扫描才行,遍历的很多

文章图片
#big data#数据库#数据仓库
数据之道读书笔记-01数据驱动的企业数字化转型

随着通信与数字技术的发展,网络化和数字化给人类带来更多的精彩和无限的可能,推动我们进入全联接的信息时代和大数据时代。因此,如何响应这个时代的变化是当前所有企业都需要考虑的问题。在这样的时代背景下,数字化转型正在改变许多企业和行业的运作模式,无论是数字原生企业,还是非数字原生企业,都在积极探索数字化转型。社会经济大环境的变化、行业趋势的变化、竞争对手的压力、公司的战略优化、自身经营的改善等是企业数字

文章图片
#大数据#人工智能
数据湖技术之 Hudi 集成 Flink

Flink集成Hudi时,本质将集成jar包:hudi-flink-bundle_2.12-0.9.0.jar,放入Flink 应用CLASSPATH下即可。Flink SQLConnector支持Hudi作为Source和Sink时,两种方式将jar包放入CLASSPATH路径:● 方式一:运行Flink SQL Client命令行时,通过参数【-j xx.jar】指定jar包● 方式二:将ja

文章图片
#大数据
数据湖技术之社交数据Hudi案例实战

1、Apache Flume:分布式实时日志数据采集框架由于业务端数据在不断的在往一个目录下进行生产, 我们需要实时的进行数据采集, 而flume就是一个专门用于数据采集工具,比如就可以监控某个目录下文件, 一旦有新的文件产生即可立即采集。2、Apache Kafka:分布式消息队列Flume 采集过程中, 如果消息非常的快, Flume也会高效的将数据进行采集, 那么就需要一个能够快速承载数据容

文章图片
#大数据#hadoop#kafka
大数据之路读书笔记-02日志采集

数据采集作为阿里大数据系统体系的第 环尤为重要。因此阿里巴巴建立了一套标准的数据采集体系方案,致力全面、高性能、规范地完成海量数据的采集,并将其传输到大数据平台。本章主要介绍数据来中的日志采集部分。阿里巴巴的日志采集体系方案包括两大体系: Ap us.JS Web(基于浏览器)日志采集技术方案: UserTrack APP 端(无线客户端日志采集技术方案。本章从浏览器的页面日志采集、无线客户端的日

文章图片
#大数据
大数据之路读书笔记-16数据应用

生意参谋诞生于2011年,最早是应用于阿里巴巴B2B市场的数据工具,2013年10月才正式进入淘系。当时阿里淘系的数据产品曾一度多达到38个,不同产品的统计方式不同,相同指标在不同产品中的数据也有所差异,这给商家带来不少的困扰。为了保证用户体验,从2014年起,依托阿里巴巴内部的OnData体系建设的、在数据一致性方面更具优势的生意参谋陆续整合量子恒道、数据魔方等其他数据产品,并在2015年年底升

文章图片
#大数据#人工智能#数据挖掘
大数据之路读书笔记-14存储和成本管理

在大数据时代,移动互联、社交网络、数据分析云服务等应用迅速普及,对数据中心提出了革命性的需求,存储管理已经成为IT核心。对于数据爆炸式的增长,存储管理也将面临着一系列挑战。如何有效地降低存储资源的消耗,节省存储成本,将是存储管理孜孜追求的目标。本章主要从数据压缩、数据重分布、存储治理项优化、生命周期管理等的角度介绍存储管理优化。...

文章图片
#大数据#人工智能
主数据深度剖析与实际应用

主数据是指在企业或组织中被广泛共享和重复使用的重要核心数据。它通常包括关键的业务实体和概念,如客户、产品、供应商、员工和账户等,这些数据在各种业务流程、系统和应用程序中被反复引用和使用。主数据的质量和一致性对于企业的业务运营和决策至关重要。主数据管理是一套综合的方法、工具和流程,用于确保企业核心业务实体数据(如客户、产品、员工等)的准确性、一致性、完整性、及时性和可用性。它涉及数据治理、质量控制、

文章图片
#大数据
数据湖技术之数据中心 Hudi案例实战

本案例基于Flink SQL 与Hudi整合,将MySQL数据库业务数据,实时采集存储到Hudi表中,使用Presto和Flink SQL分别进行离线查询分析和流式查询数据,最后报表存储到MySQL数据库,使用FineBI整合进行可视化展示。1、MySQL数据库:传智教育客户业务数据存储及离线实时分析报表结果存储,对接可视化FineBI工具展示。2、Flink SQL 引擎使用Flink SQL中

文章图片
#hive#大数据#spark
电脑输入账号密码后,屏幕黑屏只有鼠标解决办法

最近办公电脑出现了两次输入密码后,屏幕黑屏之后鼠标能动的问题,只能有手机查一些资料尝试自己解决,具体什么原因导致的暂时还不清楚。解决这个问题大概有两个方案吧,第一次黑屏用的第一个方案,第二次发现第一个方案不好用了就用的第二个方案。

文章图片
    共 19 条
  • 1
  • 2
  • 请选择