专注于大数据技术栈个人主页

@qq_36932624

专注于大数据技术栈

2022-09-29 16:53:35 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

PostgreSQL 高频常用命令整理

PostgreSQL实用命令速查指南摘要：本文整理了PostgreSQL日常运维的常用命令，涵盖系统登录、元命令、数据库/表操作、索引/触发器管理、权限控制、外部数据包装器(FDW)使用、性能排查和数据迁移等方面。重点包括：1)psql登录方式及元命令；2)数据库和表结构的增删改查；3)索引和触发器管理；4)mysql_fdw跨库访问；5)数据导入导出方法；6)性能分析和慢SQL排查；7)备份恢

#postgresql #数据库

什么是Trino？大数据统一联邦查询引擎详解

Trino是一款开源的分布式MPP SQL查询引擎，专注于跨异构数据源的联邦查询与分析。其核心特性包括：纯计算架构（存算分离）、标准SQL支持、150+数据源连接能力，可实现多源数据关联查询、湖仓统一访问、轻量ETL等功能。作为大数据生态中的计算层，Trino与OLAP引擎（StarRocks/Doris/ClickHouse）形成互补架构：前者负责多源融合与临时分析，后者专注高性能查询。典型应用

#大数据 #数据库

git使用MERGING处理

使用git上传或者下拉中出现MERGING，这是合并冲突了三种解决方法1.解决冲突，删除代码中矛盾的代码，然后上传或者下拉2.回退git reset --hard head到操作前的状态3.discard删除下载的，或者上传的代码，然后分别check out两个分支...

java.io.NotSerializableException: org.apache.hadoop.conf.Configuration

我想用火花处理一个大文本文件”mydata。txt”(实际文件的大小约为30 gb)。它的记录分隔符是“\ |”后跟“\ \ \”。因为加载文件(通过“sc.textFile”)的默认记录分隔符是“\ \ \”,我将org.apache.hadoop.conf.Configuration的“textinputformat.record.delimiter”属性设置为“\ | \ n”指定记录分..

sparkSQL实战详解

1、sparkSQL层级当我们想用sparkSQL来解决我们的需求时，其实说简单也简单，就经历了三步：读入数据 -> 对数据进行处理 -> 写入最后结果，那么这三个步骤用的主要类其实就三个：读入数据和写入最后结果用到两个类HiveContext和SQLContext，对数据进行处理用到的是DataFrame类，此类是你把数据从外部读入到内存后，数据在内存中进

java学习--类和对象的关系

本文介绍了Java中类和对象的核心概念及其关系。类是抽象的模板，定义了事物的属性和方法（如汽车类的颜色、品牌和启动方法），而对象是类的具体实例（如特定的特斯拉汽车）。类不占用内存，对象通过new创建并占用内存。一个类可生成多个对象，每个对象拥有独立的属性值。两者的关系类似于设计图和实际建筑，类是抽象定义，对象是具体实现。理解这种关系是掌握面向对象编程的基础。

#java #学习 #开发语言

java学习--ArrayList

ArrayList是Java中基于动态数组的List实现，支持快速随机访问(O(1))但增删效率较低(O(n))。核心特性包括：动态扩容（默认1.5倍）、允许null值和重复元素、有序存储。常用操作包括add/get/set/remove等，遍历时需注意使用迭代器删除元素避免异常。非线程安全，初始容量默认为10，建议预估容量优化性能。相比普通数组，ArrayList长度可变且提供丰富操作方法，但只

#java #学习

python安装gradio

本文介绍了如何使用pip3安装指定版本的gradio(4.44.1)和gradio-client(1.3.0)。建议通过阿里云镜像源加速下载，避免网络问题。安装命令格式为：pip install package==version -i 镜像源URL --trusted-host，其中镜像源使用阿里云地址。这种方法既能确保安装指定版本，又能提高下载速度。

#python #linux #开发语言

Apache Paimon：为大规模数据场景打造 “统一存储语言”

Apache Paimon是Apache旗下开源的分布式表格式系统，定位为数据湖的组织层，融合数据湖与数据仓库优势，实现流批一体管理。它解决了传统数据仓库难以处理实时数据、数据湖缺乏事务一致性的痛点，通过分层存储、LSM优化和全链路事务三大核心技术，支持高效读写和数据可靠。Paimon在金融、电信、零售等行业应用广泛，为实时数据分析提供统一存储语言，成为构建实时数仓的关键组件。

#apache #大数据 #数据库

java学习--break、return、continue解释

Java中控制流程的关键字区别：break用于终止循环或switch语句，完全跳出当前代码块；continue仅跳过当前循环的本次迭代，继续下一次循环；return则直接结束当前方法的执行，可返回结果。典型场景：break适用于提前结束循环或switch分支，continue用于过滤循环条件，return用于方法返回或提前退出。简单记忆：break跳循环，continue跳本次，return跳方法

#java #python #开发语言

共 26 条

请选择