云祁个人主页

@BeiisBei

云祁

2022-06-24 21:13:07 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Spark SQL 深度优化实战指南：从原理到生产的完整方法论

哈喽，我是云祁，好久不见～今天和大家聊聊 Spark SQL 优化，结合深度扩展的经验，增加了原理剖析、生产实践案例、性能对比数据和系统化诊断方法。错误 3：org.apache.spark.shuffle.FetchFailedException。：某电商公司的日志分析任务，数据量从凌晨的 100GB 到晚上的 2TB 波动巨大。：Spark SQL 的优化不再是简单的"调参游戏"，而是需要理

#spark #sql #大数据 +2

关于数据湖 Paimon，万字长文带你快速入门（上）

For fields.<field-name>.sequence-group, valid comparative data types include: DECIMAL, TINYINT, SMALLINT, INTEGER, BIGINT, FLOAT, DOUBLE, DATE, TIME, TIMESTAMP, and TIMESTAMP_LTZ. sequence-group支持以上这些

#javascript #开发语言 #ecmascript

【Flume】（一）Flume 高可用的、高可靠的、分布式日志收集系统

文章目录一、初识 Flume二、安装 Flume三、简单案例实现(单节点实现)四、Flume Source1、netcat 源2、avro 源3、exec 源4、JMS 源5、Spooling Directory 源一、初识 FlumeFlume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统， Flume支持在日志系统中定制各类数据发送方，用于收集数据；..

#flume

【大数据面试题】（五）Spark 相关面试题总结

文章目录一、spark中的RDD是什么，有哪些特性？二、概述一下spark中的常用算子区别（map,mapPartitions，foreach，foreachPatition）？三、谈谈spark中的宽窄依赖？四、spark中如何划分stage？五、RDD缓存？六、driver 的功能是什么？七、Spark master 使用zookeeper 进行HA 的，有哪些元数据保存在Zookeeper？

#spark

【数据挖掘算法】（一）MSET 算法

文章目录一、算法介绍二、算法步骤三、过程说明一、算法介绍MSET(Multivariate State Estimation Technique)是由Singer等提出的一种非线性的多元预测诊断技术，是一种通过分析对比实际监测参数与设备正常运行时的健康数据为基础，对正常运行时的各个参数进行运算并做出估计，以这种正常的状态估计作为标准。当得到实际的运行数据时，同样以健康数据为基础，并找到实际数据..

#算法

从1到2: 我的大数据成长之路

我是大熊！某大厂数据负责人。文末分享：我如何5年就带团队了？截图是我重读《大数据之路1》做的笔记。因为2看了一些，它已经发展到走出阿里的阶段，视野更开拓，而我越觉得自己基础不扎实，所以才有此重读。读书的意义是把前辈的经验，映射到自己的环境去解决实际问题。首篇：日志采集它有什么资格放首位？我问自己。业界公认电商平台玩的就是流量，核心就是做流量分配，因此我回看了阿里24Q4财报。淘天集团Custome

#大数据

用户行为分析大数据平台之（一）项目介绍

文章目录一、项目概述二、业务模块介绍2.1　用户访问session分析2.2　页面单跳转化率统计2.3　热门商品离线统计2.4　广告流量实时统计一、项目概述本项目主要用于互联网电商企业中，使用Spark技术开发的大数据统计分析平台，对电商网站的各种用户行为（访问行为、购物行为、广告点击行为等）进行复杂的分析。用统计分析出来的数据，辅助公司中的PM（产品经理）、数据分析师以及管理人员分析现有产品..

#大数据

阿里云云安全 ACP（一）安全基础知识及云盾概览

文章目录一、互联网的组成二、互联网的风险三、Top N 攻击详解四、阿里云安全体系五、云盾的安全防护一、互联网的组成二、互联网的风险三、Top N 攻击详解四、阿里云安全体系五、云盾的安全防护...

#阿里云 #安全

《大数据之路：阿里巴巴大数据实践》：看阿里人从IT时代走向DT时代的经验之谈！

最近一直在看《大数据之路：阿里巴巴大数据实践》一书，读完之后感觉受益良多。第一，对于整个大数据的体系有了更多且清晰的认知；第二，对于不同系统的逻辑处理方式给予了引导；第三，毕竟是阿里多年技术的累计产出，而且都是阿里技术大牛写的，干货相当多；最后，如果对于大数据方向想有更深入的了解，推荐阅读本书。

#大数据 #阿里云 #数据挖掘 +2

阿里云云安全 ACP（二）云盾的网络级防护

文章目录一、基础DDoS防护二、DDoS防护包与抗D流量包三、DDoS高防IP四、DDoS高防（国际）五、云防火墙六、安全组一、基础DDoS防护DDoS 攻击究竟是什么？可能举个例子会更加形象点。我开了一家有五十个座位的重庆火锅店，由于用料上等，童叟无欺。平时门庭若市，生意特别红火，而对面二狗家的火锅店却无人问津。二狗为了对付我，想了一个办法，叫了五十个人来我的火锅店坐着却不点菜，让别的客人无法吃

#网络 #安全

共 44 条

请选择