logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于 NVIDIA GPU 和 RAPIDS 加速 Spark 3.0

导读:今天给大家分享的主题是基于NVIDIA GPU和RAPIDS加速Apache Spark 3.0,首先会介绍Apache Spark的RAPIDS加速器及工作原理,然后分享我们对于S...

#大数据#编程语言#hadoop +2
谷歌发布 Gemini 3:最智能的模型,助你将任何想法变为现实

与此同时,Gemini 3今日也将登陆Gemini应用,面向AI Studio与Vertex AI(顶点AI)的开发者开放,并集成至我们全新的智能体开发平台Google Antigravity(谷歌反重力)——更多细节将在下文介绍。得益于我们在AI创新领域差异化的全栈式布局(从领先的基础设施,到世界级的研究成果、模型与工具,再到触达全球数十亿用户的产品),我们得以以前所未有的速度向世界交付先进的A

#人工智能#大数据
后端,还是大数据?

最近到了招聘旺季,发现一些朋友很纠结一个问题:做后端开发和做大数据开发?这个问题还是比较普遍的。其实,后端开发,更专注于一种技术栈的开发,对于成熟的开发框架而言,的确市面上的竞争压力会比...

#百度#编程语言#面试
史上最全的大数据学习资源(Awesome Big Data)

为了让大家更好地学习交流,过往记忆大数据花了一个周末的时间把Awesome Big Data里近 600 个大数据相关的调度、存储、计算、数据库以及可视化等介绍全部翻译了一遍,供大家学习交流。关系型数据库管理系统MySQL世界上最流行的开源数据库。PostgreSQL世界上最先进的开源数据库。Oracle Database- 对象关系数据库管理系统。Teradat...

#大数据#数据库
华为云FusionInsight MRS融合大数据平台进阶之路

【摘要】 FusionInsight 8.0 MRS新版本由华为研发团队精心打磨,是产品演进的重要转折点,通过对CarbonData、HetuEngine及众多社区组件的升级...

#数据库#大数据#分布式 +2
Hive计算引擎大PK,万字长文解析MapRuce、Tez、Spark三大引擎

Hive从2008年始于FaceBook工程师之手,经过10几年的发展至今保持强大的生命力。截止目前Hive已经更新至3.1.x版本,Hive从最开始的为人诟病的速度慢迅速发展,开始支持更...

#大数据#数据仓库#hadoop +1
Spark向量化计算在美团生产环境的实践

总第592篇 |2024年第012篇Apache Spark是一个优秀的计算引擎,广泛应用于数据工程、机器学习等领域。向量化执行技术在不升级硬件的情况下,既可获得资源节省,又能加速作业执行。Gluten+Velox解决方案为Spark换上了向量化执行引擎,本文将阐述美团在这一方向的实践和思考。1 什么是向量化计算1.1 并行数据处理:SIMD指令1.2 向量化执行框架:数据局部性与运行时开销1..

#spark#大数据#分布式
工业数据治理:全解时序数据处理工具

时序数据处理应用于物联网、车联网、工业互联网领域的过程数据采集、过程控制,并与过程管理建立一个数据链路,属于工业数据治理的新兴领域。从工具维度看,时序数据处理工具与传统时序数据库的差异很...

#数据库#大数据#分布式 +2
阿里云IoT工业数据上云优化实践

导读:工业互联网技术,是物联网技术、云边协同、数据库、实时计算等领域的综合应用场景。本文会从工程实践角度,讲述智能制造数字化赋能转型的角度,并结合智能制造转型应用案例,端到端地讲述阿里云I...

#大数据#编程语言#人工智能 +2
Kafka运维大全来了!优化、监控、故障处理……

作者介绍小火牛,项目管理高级工程师,具有多年大数据平台运维管理及开发优化经验。管理过多个上千节点集群,擅长对外多租户平台的维护开发。信科院大数据性能测试、功能测试主力,大...

    共 127 条
  • 1
  • 2
  • 3
  • 13
  • 请选择