
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
(一)数据可视化的目的数据仓库除了有各种技术框架及理论模型外,还有一项比较重要的工作:数据可视化。试想我们在统计完成各类数据之后,如果没有系统的报表呈现,那么数据仓库的价值,便少了一种神圣的光环。那么数据可视化的作用是怎样的?通常来说,数据可视化在于通过相关的前端图形控件和丰富的色彩信息,将关键数据和特征直观地传达出来,从而能够在更多维的层面上来看待数据背后隐藏的商业信息。我们看到的数据可...
前言:本系列的技术文章不涉及实现细节,仅探讨实现思路。由于数据仓库不仅仅是一个理论概念,其数据质量等原则包含了大量的技术实现细节,因此从数据采集开始,到数据处理,至最终的数据展现,都需要进行原理上和实现上的思路分析,才能保证最终数据仓库理论的完整实现。另外,需要强调的是,本系列文章非原创,是笔者多年从业经历的一种思路整理,对于日常理解数据仓库的实现有着很大的帮助,因而用到了非常多其他文章的引用,并
一、技术路线图二、数据库直连同步由于对于数据仓库系统而言,业务系统的数据多种多样,但由于技术惯性等原因,现有业务数据大多存储在Mysql或者Postgresql中,并且以结构化的方式进行存储。通过定义好的规范接口,以API的形式同步,是常见的数据库直连同步,调用数据库标准方法即可实现。这种方式配置简单,实现非常容易,但是对于业务系统的影响较大。通常情况下,业务系统会采用主备的策略来实现...
有人说,数据仓库搭建失败的概率非常高,是ERP之后最不靠谱的大型项目之一。往往在项目立项的时候,我们会给老板呈现出一幅非常美的愿景图:响应快、业务驱动、智能化……但当项目上线之后,才会发现这个项目往往华而不实,要什么没什么,慢慢的投入就会逐步减少,直到项目陷入泥潭……那么数据仓库在搭建过程中,遇到的核心问题是什么,我们又是怎样应对这些核心问题的,今天就挑选三个代表性的问题,来进行一一的解答。...
有人说,数据仓库搭建失败的概率非常高,是ERP之后最不靠谱的大型项目之一。往往在项目立项的时候,我们会给老板呈现出一幅非常美的愿景图:响应快、业务驱动、智能化……但当项目上线之后,才会发现这个项目往往华而不实,要什么没什么,慢慢的投入就会逐步减少,直到项目陷入泥潭……那么数据仓库在搭建过程中,遇到的核心问题是什么,我们又是怎样应对这些核心问题的,今天就挑选三个代表性的问题,来进行一一的解答。...
从2024年下半年开始,大模型的应用生态迅速爆发,第一个给我带来震撼的是Cursor,意图识别的准确率做到了相当高的水平;第二个就是春节期间的DeepSeek,第一次让我看到了本地部署和微调的可能性。这篇文章简要介绍下大模型在“数据仓库”领域的一些常见应用方式,以及我自己使用的一些心得体会。

|0x00什么是分布式计算这里我引用知乎上的介绍:“分布式计算(Distributedcomputing)是一种把需要进行大量计算的工程数据分割成小块,由多台计算机分别计算,在上传运算结果后,将结果统一合并得出数据结论的科学。”讲到分布式计算,大多数人第一时间想到的,就是“Hadoop”,它的诞生就是为了解决海量数据的计算问题。Hadoop以谷歌三大论文为蓝本,GoogleFS、MapReduce
从2024年下半年开始,大模型的应用生态迅速爆发,第一个给我带来震撼的是Cursor,意图识别的准确率做到了相当高的水平;第二个就是春节期间的DeepSeek,第一次让我看到了本地部署和微调的可能性。这篇文章简要介绍下大模型在“数据仓库”领域的一些常见应用方式,以及我自己使用的一些心得体会。








