logo
publist
写文章

简介

20年IT老兵,公众号【架构师研究会】,微信:ca_cea

擅长的技术栈

企业架构

可提供的服务

暂无可提供的服务

【数据湖仓】数据湖和仓库:Azure Synapse 视角

是时候将数据分析迁移到云端了。我们将讨论 Azure Synapse 在数据湖和数据仓库范式规模上的定位。在本文中,我们将讨论 Microsoft 的 Azure Synapse Analytics 框架。具体来说,我们关注如何在其中看到数据仓库和数据湖范式的区别。为了熟悉这个主题,我建议你先阅读本系列的前几篇文章。数据湖和仓库第 1 部分:范式简介数据湖和仓库第 2 部...

#数据仓库#大数据#编程语言 +2
【韧性架构设计】分布式系统的韧性

由许多协同工作的微服务组成的云原生应用程序架构形成了一个分布式系统。确保分布式系统可用——减少其停机时间——需要提高系统的弹性。弹性是使用提高可用性的策略。弹性策略的示例包括负载平衡、超时和自动重试、截止日期和断路器。弹性可以通过不止一种方式添加到分布式系统中。例如,让每个微服务的代码都包含对具有弹性功能的代码库的调用,或者让特殊的网络代理处理微服务请求和回复。弹性的最终...

#网络#大数据#分布式 +2
【数据湖仓】数据湖和仓库:Databricks 和 Snowflake

是时候将数据分析迁移到云端了。我们比较了 Databricks 和 Snowflake,以评估基于数据湖和基于数据仓库的解决方案之间的差异。在这篇文章中,我们将介绍基于数据仓库和基于数据湖的云大数据解决方案之间的区别。我们通过比较多种云环境中可用的两种流行技术来做到这一点:Databricks 和 Snowflake。正如我们在上一篇文章中了解到的,数据分析平台可以分为多...

#数据仓库#数据库#大数据 +2
【Python架构】在 Python 中使用架构模式管理复杂性

你的源代码是不是感觉像一个大泥球?依赖项是否在您的代码库中交织在一起,以至于改变感觉很危险或不可能?随着业务的增长和领域模型(您在应用程序中解决的业务问题)变得更加复杂,我们如何在不从头开始重新编写所有内容的情况下解开我们创建的混乱?更好的是,我们如何避免一开始就陷入混乱?鸟瞰图以下是 Python 架构模式中介绍的技术的简要总结:分层架构单一职责视图 vs 服务 vs 存储库 vs ORM vs

文章图片
#架构
微软数据湖架构

一个无限制的数据湖为智能行动提供动力:存储和分析PB级大小的文件和数以万亿计的对象开发大规模并行程序简单调试和优化您的大数据程序轻松企业级安全,审计和支持在几秒钟内开始,即刻扩展,按工作付费基于YARN,专为云计算而设计Azure Data Lake包含了使开发人员,数据科学家和分析人员能够轻松存储任何大小,形状和速度的数据,并跨平台和语言进行所有类型的处理和分析所需的所...

#数据仓库#大数据#java +2
「大数据」Hadoop生态系统:分布式计算系统

Apache IgniteApache Ignite In-Memory Data Fabric是一个分布式内存平台,用于实时计算和处理大规模数据集。它包括分布式键值内存存储,SQL功能,map-reduce和其他计算,分布式数据结构,连续查询,消息和事件子系统,Hadoop和Spark集成。 Ignite是用Java构建的,提供.NET和C ++ API。Apache ...

文章图片
#分布式#编程语言#大数据 +2
【物联网】11个物联网消息传递的神话

由于实时数据处理和交付的问题,许多应用开发神话涌现在企业物联网市场。这篇文章看起来流行那些神话气球。每个人都喜欢一个好的神话。这使娱乐餐桌谈话。但是有时神话阻碍了解决问题的方式,不幸的是,在技术世界里,这可能意味着浪费时间,金钱和资源。企业物联网(IoT)市场是一个竞争激烈的地方,应用程序开发的神话泛滥。这些神话中的很多都涉及实时数据处理和交付,这是企业物联网应用程序开发...

#网络#大数据#编程语言 +2
75个每个人都应该知道的大数据术语

在第一篇文章中介绍了以下术语:算法,分析,描述性分析,规定分析,预测分析,批处理,Cassandra,云计算,集群计算,黑暗数据,数据湖,数据挖掘,数据科学家,分布式文件系统,ETL,Hadoop,内存计算,IOT,机器学习,Mapreduce,NoSQL,R,Spark,流处理,结构化。非结构化数据。现在我们来看看还有50个更大的数据条款。Apache软件基金会(ASF...

#数据库#网络#算法 +2
AWS :什么是数据湖

在一个集中的存储库中安全地存储,分类和分析所有数据。传统的数据存储和分析工具不再能够提供交付相关业务见解所需的灵活性和灵活性。这就是为什么许多组织正在转向数据湖架构。数据湖是一种架构方法,可让您将大量数据存储到中央位置,因此可随时由组织内的不同组群进行分类,处理,分析和使用。由于数据可以按原样存储,因此不需要将其转换为预定义的模式,而且您不再需要事先知道要提交数据的问题。...

#大数据#java#人工智能 +2
「大数据架构」Spark 3.0发布,重大变化,性能提升18倍

我们激动地宣布,作为Databricks运行时7.0的一部分,可以在Databricks上使用Apache SparkTM 3.0.0版本。3.0.0版本包含超过3400个补丁,是开源社区做出巨大贡献的顶峰,带来了Python和SQL功能方面的重大进步,并关注于开发和生产的易用性。这些举措反映了该项目如何发展,以满足更多的用例和更广泛的受众,今年是它作为一个开源项目的10...

#人工智能#大数据#编程语言 +2
    共 113 条
  • 1
  • 2
  • 3
  • 12
  • 请选择