logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Hudi社区 | 致广大数据湖用户的一封信

随着数据湖概念的流行,涌现了很多关于Apache Hudi的文章,但很多文章在阐述时仅仅将Hudi当做一种表格式,这引发了社区的思考,思考Hudi的愿景到底是什么,并且在Hudi社区发起了...

#数据库#java#大数据 +2
大数据正当时,理解这几个术语很重要

目前,大数据的流行程度远超于我们的想象,无论是在云计算、物联网还是在人工智能领域都离不开大数据的支撑。那么大数据领域里有哪些基本概念或技术术语呢?今天我们就来聊聊那些避不开的大数据技术术语,梳理并补充我们对大数据的理解。01离线计算 Vs 实时计算离线计算离线计算,通常也称为“批处理”,表示那些离线批量、延时较高的静态数据处理过程。离线计算适用于实时...

EMR Studio:新一代开源大数据开发平台开启公测

作者简锋,阿里云 EMR Studio 负责人2021年11月,EMR Studio:新一代开源大数据开发平台正式开启公测。EMR Studio 能够无缝关联 EMR 集群(EMR on...

#大数据#java#人工智能 +2
仅需单卡14G显存!手把手教你训练+推理爆火开源模型 DeepSeek-R1

Deepseek RI最近火爆全网,甚至影响到了全球经济走势和政治格局,不得不说AI依然在迅猛的发展,R1的内置COT理念——就是人类的慢思考。人的大脑有两个系统:系统一基于潜意识,快速做出判断,称为“快思考”;系统二则相反,处理复杂问题,但需要专注力和精力,称为“慢思考”。两者相互影响,大多数偏见来自系统一,但可以通过训练改善。R1开始让AI有了”系统二“的能力,是一种高阶的智慧,最先让AI有慢

应用实践 | 物易云通基于 Apache Doris 的实时数据仓库建设

导读:物易云通目前已成为国内产融供应链运营服务平台的领军企业之一,平台年交易额超过 200 亿元,随着公司业务的快速发展,对数据计算分析的时效要求也越来越高。经数据团队的调研对比,于 2021 年引入了 Apache Doris 作为实时数据仓库。实战过程中获得一些经验,在此分享给大家。作者|物易云通/司机宝大数据负责人吴凡业务背景武汉物易云通网络科技有限公司成立于 2...

#数据库#大数据#hadoop +2
浅谈我所见识的数据治理项目

开篇一张图与正文不一定有关图片来源于朋友圈01写在前面熟悉笔者的朋友可能知道,笔者之前做的并非纯数据相关工作(产品或项目),笔者属于半路出家的数据人,之前也几乎没有直接接触过数据仓库、数据中台、数据平台等产品或项目,与数据库是一直打交道。要说真正与数据结缘,那得从16年8月起说起,当时因公司某些产品基于传统关系型数据库与一些开源数据仓库产品(如InfoBright)跑...

#数据库#大数据#编程语言 +1
Cube.js 试试这个新的数据分析开源工具

cube.JS1 cube.JS简介Cube是无界面商业智能平台。它帮助数据工程师和应用程序开发人员从现代数据存储中访问数据,将其组织为一致的定义,并将其交付给每个应用程序。Cube 旨在与所有支持 SQL 的数据源一起工作,包括像 Snowflake 或 Google BigQuery 这样的云数据仓库、像 Pr...

#java#大数据#数据库 +2
大数据正当时,理解这几个术语很重要

目前,大数据的流行程度远超于我们的想象,无论是在云计算、物联网还是在人工智能领域都离不开大数据的支撑。那么大数据领域里有哪些基本概念或技术术语呢?今天我们就来聊聊那些避不开的大数据技术术语,梳理并补充我们对大数据的理解。01离线计算 Vs 实时计算离线计算离线计算,通常也称为“批处理”,表示那些离线批量、延时较高的静态数据处理过程。离线计算适用于实时...

一文读懂 Kafka 事务机制

这篇文章主要讲述 Kafka 事务性相关原理,从 Kafka EOS 语义、幂等性、事务性等几个方面阐述。

到底了