零度下的温柔个人主页

@weixin_45695430

零度下的温柔

2022-11-24 21:47:14 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

大数据培训 | Flink SQL窗口表值函数聚合实现原理

SqlWindowTableFunction及其各个实现类的主要工作是校验TVF的操作数是否合法(通过内部抽象类AbstractOperandMetadata和对应的子类OperandMetadataImpl)。这一部分不再赘述，在下文改进累积窗口TVF的代码中会涉及到_大数据培训。...

#大数据 #flink #sql

web前端培训：WEB 安全相关面试题分享

1、SQL 注入SQL注入攻击的核心在于让Web服务器执行攻击者期望的SQL语句，以便得到数据库中的感兴趣的数据或对数据库进行读取、修改、删除、插入等操作，达到其邪恶的目的。而如何让Web服务器执行攻击者的SQL语句呢？SQL注入的常规套路在于将SQL语句放置于Form表单或请求参数之中提交到后端服务器，前端培训后端服务器如果未做输入安全校验，直接将变量取出进行数据库查询，则极易中招。举例如下：对

#前端 #安全 #javascript

大数据培训flink8 个高频面试实战题分享

01生产环境中，如何快速判断哪个算子存在反压呢？或者说哪个算子出现了性能问题？将这个问题拆解成多步来分析：如何知道算子是否有反压？在 Flink web ui 中，定位到一个具体的算子之后，查看 BackPressure 模块，通过颜色和数值来判断任务的繁忙和反压情况。若颜色为红色，表示当前算子繁忙，有反压的情况；若颜色为绿色，标识当前算子不繁忙，没有反压。2.举个实际 Flink 任务案例，这个

#flink #大数据

大数据培训关于数据采集面试问题分享

以下文章来源于数据社什么是大数据采集数据采集是大数据的基石，不论是现在的互联网公司，物联网公司或者传统的IT公司，每个业务流程环节都会产生大量的数据，同时用户操作的日志也会产生大量的数据，为了将这些结构化和非结构化的数据进行采集，我们必须要有一套完整的数据采集方案流程，为后续的数据分析应用提供数据基础。根据不同业务场景，对于数据采集的时效性要求也是不一样的，一般分为离线数据采集和实时数据采集。离线

#大数据 #面试

大数据培训Spark框架：RDD、DataFrame的区别

RDD、DataFrame是什么在Spark中，RDD、DataFrame是最常用的数据类型。什么是RDD？RDD（Resilient Distributed Datasets）提供了一种高度受限的共享内存模型。即RDD是只读的记录分区的集合，只能通过在其他RDD执行确定的转换操作（如map、join和group by）而创建，然而这些限制使得实现容错的开销很低。RDD仍然足以表示很多类型的计算，

#big data #spark #scala

大数据培训 Hive 相关知识的全面总结

但是在大数据环境下，通常数据的来源是服务端的埋点数据，很可能需要把程序中的某些对象内容作为输出的一部分，而每一个对象都可能是嵌套的，所以如果能够原生的支持这种数据，这样在查询的时候就不需要额外的解析便能获得想要的结果_大数据培训。...

#hive #大数据 #hadoop

大数据培训：Spark 性能调优详解

调优概述有的时候，我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜，此时Spark作业的性能会比期望差很多。数据倾斜调优，就是使用各种技术方案解决不同类型的数据倾斜问题，以保证Spark作业的性能。数据倾斜发生时的现象绝大多数task执行得都非常快，但个别task执行极慢。比如，总共有1000个task，997个task都在1分钟之内执行完了，但是剩余两三个task却要一两个小时。这种情况很

#spark #big data #大数据

大数据培训-Flink面试知识分享

以下文章来源于大数据左右手，作者左右一. Flink 提交系列1. Flink怎么提交?Local模式JobManager 和 TaskManager 共用一个 JVM,只需要jdk支持，单节点运行，主要用来调试。Standlone模式Standlone 是Flink自带的一个分布式集群，它不依赖其他的资源调度框架、不依赖yarn 等。充当Master角色的是JobManager。充当Slave

#flink #大数据

大数据培训：Hadoop和MPP有什么区别

在最近的时间里，我听到了很多关于该主题的讨论。同样，这是一个非常受欢迎的问题，是由在“大数据”领域经验不足的客户提出的。实际上，我不喜欢这个含糊不清的流行语，但这就是客户通常会来找我们的原因，因此我必须使用它。如果回头看5年前，那是大多数公司都不选择Hadoop的时候，尤其是对于那些要求稳定和成熟平台的企业而言。那时，选择非常简单：当分析数据库的大小超过5-7 TB时，您只需启动一个MPP迁移项目

#hadoop #big data #数据仓库

大数据培训Flink 简介与认知

Flink Logo Flink 项目的理念是：“Apache Flink 是为分布式、高性能、随时可用以及准确的流处理应用程序打造的开源流处理框架”_大数据培训。

#big data #flink #java

共 43 条

请选择