logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【大数据Hive3.x数仓开发】数仓中数据发生变化如何实现数据存储--拉链表详解

拉链表专门用于解决在数据仓库中==数据发生变化如何实现数据存储==的问题。拉链表的设计是==将更新的数据进行状态记录==,没有发生更新的数据不进行状态存储,用于存储所有数据在不同时间上的所有状态,==通过时间进行标记每个状态的生命周期==,查询时,根据需求可以获取==指定时间范围状态的数据==,默认用9999-12-31等最大值来表示最新状态。

文章图片
#大数据
python 使用Pandas进行数据清洗

文章目录数据缺失缺失值检测 isnull()丢弃缺失值dropna()缺失值填充fillna()数据重复去重复值drop_duplicates()数据不一致值替换replace异常值处理数据清洗:对采集的数据进行重新审查和校验的过程,其目的在于删除重复信息、纠正存在的错误,保证数据的一致性。常见问题:数据缺失、数据重复、数据不一致数据缺失缺失值检测 isnull()丢弃缺失值dropna()dro

#python#数据挖掘#数据分析
有哪些国外常用的论文网站

1、Wiley InterScience(英文文献期刊)Wiley InterScience是John Wiely & Sons公司创建的动态在线内容服务,1997年开始在网上开通。通过InterScience,Wiley公司以许可协议形式向用户提供在线访问全文内容的服务。Wiley InterScience收录了360多种科学、工程技术、医疗领域及相关专业期刊、30多种大型专业参考书、.

计算机网络——p1 ping p2过程详解

文章目录IP数据包的交换转发PC1 ping PC2过程分析IP数据包的路由转发过程分析转载自:p1 ping p2过程分析IP数据包的交换转发PC1 ping PC2过程分析pc1的ip地址为1.1.1.1,pc2的ip地址为1.1.1.2,两者通过交换机sw1连接。在pc1上ping pc2,即pc1向 pc2发起icmp请求。...

Python中and,or,&,| 以及三目运算符

a,b是数值变量python中的&符号延续的了C/C++的含义,指的是位运算;而用and、or来代替C/C++中的&&、||,来进行逻辑运算。&, |:#2在二进制里面是10,1在二进制中是011 & 2# 输出为 0,1 | 2# 输出为3and 、or在python中,由于短路效应:a an...

【大数据Hive3.x数仓开发】HiveSQL行转列应用-多行转多列case when&多行转单列concat_ws,collect

关于多行转多列,多行转单列的应用场景及实现,涉及case when,concat_ws,collect等函数。

【数据可视化】Tableau零基础-常用操作记录(人口金字塔和漏斗图绘制过程)

零基础学习过程中一些基础操作记录。主要记录人口金字塔和漏斗图绘制过程。

文章图片
#信息可视化#数据分析#数据挖掘
【计算机前沿知识】大数据与数据挖掘

大数据概念大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。简述大数据的特点大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(

#大数据#数据挖掘
【数据分析师求职面试指南】必备基础知识整理

内容整理自《拿下offer 数据分析师求职面试指南》---徐粼著第三章基础知识考查对数据分析必备的统计知识、数据挖掘知识、常见模型及评估方法进行总结。

文章图片
#概率论#机器学习#人工智能
    共 13 条
  • 1
  • 2
  • 请选择