logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

分布式ID生成方案

不管我们是不是有身份的人,我们一定是有身份证的人,身份证上面的号码就是我们的ID,理论上这个ID是全国唯一的,而且通过这个号码,我们还可以得到一些个人信息,比如前两位可以确定我们第一次申...

#数据库#java#python +1
Apache Flink OLAP引擎性能优化及应用

分享嘉宾:贺小令阿里巴巴技术专家编辑整理:王吉东内容来源:Flink Forward ASIA出品平台:DataFun注:转载请在公众号后台回复“转载”。导读:本次分享的主题为Apac...

大数据平台架构设计探究

近年来,随着IT技术与大数据、机器学习、算法方向的不断发展,越来越多的企业都意识到了数据存在的价值,将数据作为自身宝贵的资产进行管理,利用大数据和机器学习能力去挖掘、识别、利用数据资产。...

数仓(三)简析阿里、美团、网易、恒丰银行、马蜂窝5家数仓分层架构

上一篇我们介绍了数据集市的概念以及它和数仓的区别,并且重点论述了大数据数仓中的分层架构体系。这篇我们简要分析一下以下5家公司的数仓分层架构模型:1、马蜂窝数仓分层架构2、阿里云MaxCom...

#数据仓库#大数据#数据分析 +2
美团商品知识图谱的构建及应用

导读:在互联网新零售的大背景下,商品知识图谱作为新零售行业数字化的基石,提供了对于商品相关内容的立体化、智能化、常识化的理解,对上层业务的落地起到了至关重要的作用。相比于美团大脑中围绕商户...

#大数据#自然语言处理#机器学习 +2
干货 :基于用户画像的聚类分析

聚类(Clustering),顾名思义就是“物以类聚,人以群分”,其主要思想是按照特定标准把数据集聚合成不同的簇,使同一簇内的数据对象的相似性尽可能大,同时,使不在同一簇...

Flink+StarRocks 实时数据分析新范式

01极速数据分析统一 OLAP 分析的趋势,以及 StarRocks 极速查询分析的核心能力。计算机科学里所有难题,都能通过加中间层的方式来解决,但是不能加的东西太多。回想 Hadoop 生态演变的过程,先有了分布式存储,解决了海量数据如何用廉价的设备,来存储的问题。又有 MapReduce 帮助我们慢悠悠的解决了,分布式处理的问题。为了让只会写 SQL 的分析师,能够专注于业务,不用担心 Jav

#flink#数据分析#大数据 +1
Flink CDC + OceanBase 全增量一体化数据集成方案

摘要:本文整理自 OceanBase 技术专家王赫(川粉)在 5 月 21 日 Flink CDC Meetup 的演讲。主要内容包括:OceanBase 介绍Flink CDC OceanBase Connector 实现原理Flink CDC + OceanBase 应用场景Flink CDC OceanBase Connector 未来展望Tips:点击「阅读原文」查看原文视频 &

#flink#oceanbase#大数据
阿里大数据之路:数据模型篇大总结(收藏)

第1章 大数据领域建模综1.1 为什么需要数据建模有结构地分类组织和存储是我们面临的一个挑战。数据模型强调从业务、数据存取和使用角度合理存储数据。数据模型方法,以便在性能、成本、效率之间取得最佳平衡成本:良好的数据模型能极大地减少不必要的数据冗余,也能实现计算结果复用,极大地降低大数据系统中的存储和计算成本。效率:良好的数据模型能极大地改善用户使用数据的体验,提高使用数据的效率。质量:良好的数据模

#大数据#数据仓库#数据挖掘 +1
8个数据分析模型简介

大家在工作中是不是经常要做各种分析,但又常常遇到无从下手,抓不住重点,搞不清关键数据的情况。俗话说“工欲善其事,必先利其器。”一个好用的数据分析模型,能给我们提供一种视角和思维框架,从而帮...

#大数据#人工智能#数据分析 +2
    共 137 条
  • 1
  • 2
  • 3
  • 14
  • 请选择