logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据仓库、数据湖、流批一体简介

典型大数据架构满足批处理、点查、实时分析,查询加速或联邦查询的大数据架构典型大数据架构的痛点首先是基于离线存储的Hive,其次是提供点查询能力的HBase、Cassandra、然后是MPP架构号称能面向HTAP的Greenplum、以及最新兴起的用于做快速分析的Clickhouse等等都是基于解决方案而面世的存储产品。但以上的每个存储产品都是一个数据的孤岛,比如为了解决点查询的问题,数据需要在HB

#flink
运维--shell 中数组的操作

在写程序的部署脚本或启动脚本时,经常用到shell中的数组操作,本文针对shell的数组操作进行总结 ,包括定义数组、读取数组、修改数组以及数组循环。数组介绍shell数组分为索引数组和关联数组,两者的最大的差别是:关联数组的元素是无序的、由特定格式的键值对组成、键是唯一的,同时使用键作为下标来索引关联数组元素。对于无变量类型的脚本语言,数字可以被看做特殊的字串。索引数组:即是普通的数组,通过数字

#linux
Apache DolphinScheduler征稿-- DolphinScheduler--master与worker的交互过程

海豚调度dolphinscheduler目前是Apache顶级项目,作为国内优秀的开源项目,它的架构设计理念会有很多值得我们学习和借鉴。海豚调度dolphinscheduler是分布式易扩展的可视化DAG工作流任务调度系统本文会包含如下内容:海豚调度任务执行过程中master与worker的交互过程如何处理过程中的异常本篇文章适合人群:架构师、技术专家以及对任务调度非常感兴趣的高级工程师本文以海豚

#java#分布式
JAVA加密--AES加密算法JAVA实现及使用中的各种坑,超实用

1. AES1.1. 概念密码学中的高级加密标准(Advanced Encryption Standard,AES),又称Rijndael加密法,是美国联邦政府采用的一种区块加密标准。这个标准用来替代原先的DES(Data Encryption Standard),已经被多方分析且广为全世界所使用,已然成为对称密钥加密中最流行的算法之一。详见 百科 高级加密标准 AES1.2. JAVA实现AES

文章图片
运维--shell 中数组的操作

在写程序的部署脚本或启动脚本时,经常用到shell中的数组操作,本文针对shell的数组操作进行总结 ,包括定义数组、读取数组、修改数组以及数组循环。数组介绍shell数组分为索引数组和关联数组,两者的最大的差别是:关联数组的元素是无序的、由特定格式的键值对组成、键是唯一的,同时使用键作为下标来索引关联数组元素。对于无变量类型的脚本语言,数字可以被看做特殊的字串。索引数组:即是普通的数组,通过数字

#linux
Spark性能优化原则及参数优化

1 spark优化Spark性能优化的第一步就是要在开发Spark作业的过程中注意和应用一些性能优化的基本原则。开发调优,需要了解以下一些Spark基本开发原则,包括:RDD lineage设计、算子的合理使用、特殊操作的优化等。在开发过程中,时时刻刻都应该注意以下原则,并将这些原则根据具体的业务以及实际的应用场景,灵活地运用到自己的Spark作业中。1.1 资源参数调优num-executors

#spark#性能优化
图数据库Nebula Graph如何快速导入10亿+数据

随着社交、电商、金融、零售、物联网等行业的快速发展,现实社会织起了了一张庞大而复杂的关系网,亟需一种支持海量复杂数据关系运算的数据库即图数据库。本系列文章是学习知识图谱以及图数据库相关的知识梳理与总结本文会包含如下内容:如何快速导入10亿+数据本篇文章适合人群:架构师、技术专家、对知识图谱与图数据库感兴趣的高级工程师1. nebula cluster环境nubula版本2.0.0,后端存储使用的是

#知识图谱
Alembic:python中数据库迁移的瑞士军刀

Alembic 是由 SQLAlchemy 的创始人 Mike Bayer 设计的一个数据库迁移工具。它不仅支持自动迁移脚本生成,还允许开发者手动编辑迁移脚本来满足特定的需求。Alembic 通过提供一个环境来跟踪数据库模式的变更历史,确保数据库的版本与应用代码保持同步。

文章图片
#数据库#python#迁移
如何下载huggingface或modelscope上的大模型或数据集

如何下载huggingface或modelscope上的大模型或数据集

文章图片
数据仓库系列:星型模型和雪花型模型

在实际工作中多维分析的商业智能解决方案,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。星型模型星型模型:是一种多维的数据关系,它由一个事实表(Fact Table)和一组维表(Dimension Table)组成。每个维表都有一个维作为主键,所有这些维的主键组合成事实表的主键。事实表的非主键属性称

#数据仓库
    共 82 条
  • 1
  • 2
  • 3
  • 9
  • 请选择