logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

五、数据仓库电商项目——DWT层、可与DWS合并一层

DWT层DWT层将DWS层每日聚合的数据进行积累,DWT层不是分区表,是一个累积型全量表,并且数据来源与DWS层。累积性全量表:查询要改动的旧数据,查询新增和变化的新数据,新旧关联,以新换旧,导入覆盖。DWT设备主题宽表用户主题宽表drop table if exists dwt_user_topic;create external table dwt_user_topic(user_id str

#数据仓库#big data#大数据
Flink在金融行业实时计算应用

摘要:Flink凭借低延迟、高吞吐等特性成为金融实时计算的核心引擎,主要应用于三大场景:1)实时交易分析与监控,通过CEP和聚合计算捕捉市场机会;2)实时风险管理,实现毫秒级反欺诈和信用评估;3)实时客户洞察,提供个性化服务。实施需解决端到端一致性、高可用等挑战,建议分阶段推进。Flink正推动金融行业向智能化、敏捷化方向发展,未来与AI的深度结合将进一步释放其价值。(149字)

#大数据#人工智能
五、数据仓库电商项目——DWT层、可与DWS合并一层

DWT层DWT层将DWS层每日聚合的数据进行积累,DWT层不是分区表,是一个累积型全量表,并且数据来源与DWS层。累积性全量表:查询要改动的旧数据,查询新增和变化的新数据,新旧关联,以新换旧,导入覆盖。DWT设备主题宽表用户主题宽表drop table if exists dwt_user_topic;create external table dwt_user_topic(user_id str

#数据仓库#big data#大数据
OLAP(三):Impala介绍 、 (和hive/spark对比)、COMPUTE STATS

一、Impala概述Impala是用于处理存储在Hadoop集群中的大量数据的MPP(大规模并行处理)SQL查询引擎。与其他Hadoop的SQL引擎相比,它提供了高性能和低延迟。换句话说,Impala是性能最高的SQL引擎(提供类似RDBMS的体验),它提供了访问存储在Hadoop分布式文件系统中的数据的最快方法。二、为什么选择Impala?Impala的优点:Impala数据查询效率比Hive快

#hive#hadoop
kettle--数据库间的数据迁移工具

kettle 是纯 java 开发,开源的ETL工具,用于数据库间的数据迁移。可以在 Linux、windows、unix 中运行。有图形界面,通过图形化界面的配置,可以实现数据迁移,并不用开发代码。也有命令脚本还可以二次开发。kettle的官网是。

#数据库
Spark 中 JVM 内存使用及配置详情、spark报错与调优、Spark内存溢出OOM异常

一般在我们开发spark程序的时候,从代码开发到上线以及后期的维护中,在整个过程中都需要涉及到调优的问题,即一开始需要考虑如何把代码写的更简洁高效调优(即代码优化),待开发测试完成后,提交任务时综合考量该任务所需的资源(这里涉及到资源调优),上线后是否会出现数据倾斜问题(即倾斜调优),以及是否出现频繁GC问题(这里涉及到GC调优)。那么本篇通过反推的模式,即通过GC调优进行延伸扩展,比如出现GC问

#spark#big data#scala
Python爬虫:原理与实战

在当今的信息时代,互联网上的数据如同浩瀚的海洋,充满了无尽的宝藏。Python爬虫作为一种高效的数据抓取工具,能够帮助我们轻松地获取这些数据,并进行后续的分析和处理。本文将深入探讨Python爬虫的原理,并结合实战案例,帮助读者快速掌握爬虫技术。如果我们把互联网比作一张大的蜘蛛网,数据便是存放于蜘蛛网的各个节点,而爬虫就是一只小蜘蛛,沿着网络抓取自己的猎物(数据)爬虫指的是:向网站发起请求,获取资

文章图片
#python#爬虫#开发语言
机器学习项目实战之信用卡欺诈检测

机器学习项目实战之信用卡欺诈检测(零基础,附数据及详细python代码)https://blog.csdn.net/qq_40683479/article/details/89221558项目实例---金融---用机器学习构建模型,进行信用卡反欺诈预测https://blog.csdn.net/qingqing7/article/details/80665356反...

国内AI大模型盘点

大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。原文链接:https://blog.csdn.net/2301_76168381/article/details/139677043。简介: 智谱华章自研的AI大模型,融合海量知识,可用于商业分析、决策辅助、客户服务等领域。简介: 阿里达摩院推出的大模型,拥有千亿参数,可用于智能问答、知识检索、文

#算法
DeepSeek部署在本地电脑

作为一款现象级的Ai产品,用户量暴增,最近服务器又被攻击,使用DeepSeek,经常出现服务器繁忙,将DeepSeek部署在本地电脑就方便很多。3、选择对应的模型来下载,1.5b、7b、8b、14b、32b、70b或671b,这里有很多版本可选,模型越大,要求电脑内存、显卡等的配置越高。通过以上三步,DeepSeek就部署在本地电脑上了,有些不方便公开的数据,比如实验数据,可以通过部署大模型到本地

#人工智能
    共 22 条
  • 1
  • 2
  • 3
  • 请选择