社区云

odps

Jessica925 来自讯飞AI开发者社区

xfyun.csdn.net · 2022-06-30 21:37:43

MapReduce任务优化阿里云平台ODPS Join方法等等详细解析

1 计算机性能CPU,内存,磁盘健康,网络2 I/O操作优化-数据倾斜数据输入Map阶段Reduce阶段Map长尾:Map端读取数据由于带下分布不均匀,会导致一些Map Instance读取和处理的数据特别多,造成Map长尾;主要是由于Reduce长尾:主要是keyy的分布不均匀所导致,主要场景:Join长尾:主要场景为动态分区优化:动态分区带来的小文件过多的问题进行小文件合并开窗函数的优化:某个

#mapreduce #odps #大数据

1402 

5 
摇铃唤白鹿来自讯飞AI开发者社区

xfyun.csdn.net · 2019-09-03 15:31:07

记录我的一次基于dataworks大数据平台的关于多栏位SUM求和的ODPS SQL优化

记录我的一次基于dataworks大数据平台的关于多栏位SUM求和的ODPS SQL优化背景在我所需要做的需求中，有这样一个场景，简化描述即是，基于阿里云dataworks平台用ODPS SQL脚本统计出商品订单表（order_info）的每种商品在每个月的销量情况。订单表主要字段（订单编号、商品编号、销售月份，每笔订单销售多少件）如下，每个分区订单表数据为2.5亿条：需要统计呈现的re...

#大数据 #odps #sql

1381 
mathdogggg 来自讯飞AI开发者社区

xfyun.csdn.net · 2022-11-10 15:16:55

阿里云MaxCompute开发运维手册之备份与恢复数据

小伙伴们在MaxCompute的开发中，若不慎删表或truncate表数据，内心肯定慌的一批。别急，让我们一起来学习一下MaxCompute的自动备份与恢复的功能（划重点：自动备份），帮你快速恢复数据。开发的小伙伴们再也不担心手抖了，职业生命至少延长20年。

#阿里云 #odps #数据库

991 
mathdogggg 来自讯飞AI开发者社区

xfyun.csdn.net · 2022-11-23 17:42:53

阿里云MaxCompute开发运维手册之AccessKey简介与管理

一文搞定阿里云AccessKey管理

#阿里云 #odps #运维

1587 
ZhangKx.blog 来自讯飞AI开发者社区

xfyun.csdn.net · 2021-01-28 10:14:12

阿里云数据源连接(ODPS、DRDS)

阿里云数据源连接(ODPS、DRDS)个人博客地址：++https://blog.zhangkx.cn/++一、ODPS1.准备工作1）阿里云账号的accessId和accessKey(几乎等同于账号)2）ODPS连接所需API地址，公网ODPS统一为 http://service.odps.aliyun.com/api专有云ODPS联系相关负责人员获取API地址。3）ODPS中project名称

#odps

1883 
大雨淅淅1999 来自讯飞AI开发者社区

xfyun.csdn.net · 2025-07-22 14:50:18

【大数据】小白都能懂的ODPS学习秘籍，速看！

学习 ODPS，我们从认识其概念、价值开始，逐步深入到环境搭建、核心操作，再到通过实战演练将知识应用于实际业务场景，过程中虽会遇到各类问题，但也收获了宝贵的解决经验。掌握 ODPS 技术，能让我们在大数据领域拥有更强大的数据处理和分析能力，为职业发展和项目实践增添有力的武器。

#odps #学习 #大数据

987 

25 
荼靡，来自讯飞AI开发者社区

xfyun.csdn.net · 2025-07-18 15:05:18

python连接阿里云ODPS常用操作

【代码】python连接阿里云ODPS常用操作。

#python #阿里云 #odps

451 

4 
DataWorkder_QIng 来自讯飞AI开发者社区

xfyun.csdn.net · 2020-08-06 18:07:41

解决方法：FAILED: ODPS-0130071:[0,0] Semantic analysis exception - physical plan generation failed: java.

**产生原因：**上游数据中的字段类型为decimal（38,18），下游数据类型也为decimal**解决方法：**将两表数据类型统一。上游数据的类型为decimal，下游数据类型也为decimal

#odps

1.8w 
周小董来自讯飞AI开发者社区

xfyun.csdn.net · 2022-12-03 22:32:37

[1172]python操作odps

接口手册：https://pyodps.readthedocs.io/zh_CN/latest/?spm=a2c4g.11186623.0.0.1aaf3d94n84mINPySdk下载：https://github.com/aliyun/aliyun-odps-python-sdk2、连接阿里云odps确认下载好后，连接odps，账号密码自备。3、执行sql3.1、简单执行sql3.2、通过od

#odps

3076 

1 
周小董来自讯飞AI开发者社区

xfyun.csdn.net · 2023-12-16 09:00:00

[1245]阿里云ODPS使用to_char()报错

参考：https://blog.csdn.net/lhxsir/article/details/119212723。

#odps #大数据 #数据仓库

481 
_bitdata 来自讯飞AI开发者社区

xfyun.csdn.net · 2024-11-05 11:25:00

DBAPI连接阿里云 maxcompute 报错

新建空的maven项目，使用maven坐标。，这个不是完整的，它还依赖其它jar包。，这个是完整的jar包。访问以下链接寻找驱动包。

#odps

728 

6 
悟乙己来自讯飞AI开发者社区

xfyun.csdn.net · 2021-01-04 18:41:15

阿里云MaxCompute中pyODPS的使用：多线程上传、下载、分区

文章目录1 初始化入口2 java可实现：SQLTask配合Tunnel实现大量数据导出3pyODPS3.1 sql读入3.2 DataFrame3.2.1 dataframe读入3.2.2 分区3.3 to_pandas4 与mars融合安装：pip install pyodps1 初始化入口在使用PyODPS前，您需要用阿里云账号初始化一个MaxCompute的入口，执行命令如下。from o

#odps #阿里云

7869 

6 
曹弘毅来自讯飞AI开发者社区

xfyun.csdn.net · 2023-03-10 10:39:26

阿里云odps多线程批量清理project数据

阿里云odps多线程批量清理project数据

#odps

577 
羽木492 来自讯飞AI开发者社区

xfyun.csdn.net · 2023-11-28 15:00:05

大数据MaxCompute教程（阿里云离线数仓项目）学习笔记20231128

MaxCompute 是面向分析的企业级SaaS模式云数据仓库，以Serberless框架提供快速、全托管的在线数据仓库服务，消除了传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您可以经济并高效的分析处理海量数据。MaxCompute和DataWorks一起向用户提供完善的ETL和数仓管理能力，以及SQL、MR、Graph等多种经典的分布式计算模型，能够更快速的解决用户海量数据计

#大数据 #odps #阿里云

425 

4 
csdn565973850 来自 2048 AI社区

2048ai.net · 2025-08-28 09:14:58

MaxCompute MaxFrame | 分布式Python计算服务MaxFrame（完整操作版）

本文介绍了阿里云自研的分布式计算框架MaxCompute MaxFrame的评测体验。首先概述了MaxFrame作为兼容Pandas接口的分布式Python计算框架，可支持大规模数据处理和AI开发。随后详细说明了开通MaxCompute和DataWorks服务的步骤，包括免费试用申请和正式购买流程。接着讲解了资源准备过程，包括创建工作空间、创建MaxCompute项目、配置数据源等关键操作。最后指

#odps #分布式 #python

1145 

18 
涤生大数据来自讯飞AI开发者社区

xfyun.csdn.net · 2024-02-05 12:08:37

涤生大数据实战：基于Flink+ODPS历史累计计算项目分析与优化（上）

当一个用户在T日实时上传了自己的跑步记录，Flink节点1会计算出其 [当日0点起至此刻] 的跑步累计数据data1，Flink节点2会根据该用户id取hbase维表里查询其 [历史～T-1日] 的累计数据 data2 (hbase表里数据由odps每日更新，即T-1日的存量累计汇总数据)，将data1和data2二者汇总，就可得到用户历史至此时刻的汇总数据；在凌晨时分，ODPS计算T-1日数据

#大数据 #flink #odps

1862 

27 
daydayup-2016 来自讯飞AI开发者社区

xfyun.csdn.net · 2022-08-05 00:11:23

【大数据技术】trans_array的用法及示例详解

【大数据技术】trans_array的用法及示例详解,神器

#odps #大数据 #数据仓库 +1

2618 
ddandddd 来自讯飞AI开发者社区

xfyun.csdn.net · 2022-08-25 11:53:54

2022“SEED”第三届江苏大数据开发与应用大赛报名启动，MARS竞赛平台强力技术支撑

江苏省工业和信息化厅、无锡市政府通过连续两年举办江苏大数据开发与应用大赛，已累计吸引到全球超过3800名选手参与其中，同时在医疗、能源、车联网、城市治理等前沿热门领域，均提供了大量经过数据全生命周期加工后的珍贵产业案例数据集，充分展现了无锡市数据开放、数据共享工作的成效。2022第三届江苏大数据开发与应用大赛已开启

#大数据 #人工智能 #big data +2

636 

1 
烧酒与墨来自讯飞AI开发者社区

xfyun.csdn.net · 2024-05-13 09:57:31

阿里云MaxCompute使用总结2

个人使用过程中的记录

#阿里云 #odps #云计算

638 

3 
A~good~fight 来自讯飞AI开发者社区

xfyun.csdn.net · 2025-06-07 23:42:30

阿里云MaxCompute入门

创建数据域创建一个用户域，然后在创建一个交易域创建如下。

#阿里云 #odps

1354 

28 
聚搜云_上海聚搜信息技术有限公司来自讯飞AI开发者社区

xfyun.csdn.net · 2023-11-13 18:53:49

阿里云国际站：dataworks 中从maxcompute 同步到mysql （mysql分表怎么做）？

1. 创建数据同步的节点：在 DataWorks 的数据开发页面，选择 "新建"-> "数据同步"，输入任务名称和描述，然后选择源数据源和目标数据源。3. 配置同步规则：在 "映射表字段" 区域，您可以配置哪些字段需要同步，以及对应的目标字段名称。同时，因为每个分表的数据量可能不同，所以在使用 DataWorks 做数据同步时，可能需要对分表进行单独的同步计划，或使用分布式任务并行处理。最后，值得

#阿里云 #odps #mysql +4

446 
阿里云大数据AI技术来自 2048 AI社区

2048ai.net · 2025-08-26 17:51:57

ODPS 十五周年实录 | Data + AI，MaxCompute 下一个15年的新增长引擎

本文分享了 MaxCompute 在 Data + AI 领域所做工作的介绍，包括面向 Python 生态和 AI 计算场景的演进历史，MaxCompute 在 Data + AI 领域构建的核心能力和相关解决方案，以及基于这些核心能力支撑的应用场景和成功客户案例。

#odps #人工智能 #大数据

761 

19 
程序员维他命来自讯飞AI开发者社区

xfyun.csdn.net · 2025-03-14 10:36:21

2025年大模型应用落地白皮书：企业AI转型行动指南解读（附PDF下载）

这份白皮书是《2025年大模型应用落地白皮书：企业AI转型行动指南》，由火山引擎发布，旨在为企业在大模型技术的应用落地提供指导和参考。以下是对白皮书内容的详细解读分析：核心观点• 大模型与业务深度融合：大模型技术已进入与业务深度整合的关键时期，企业正基于具体业务场景积极探索大模型的实际部署与应用潜力.• 落地周期和应用速度超预期：大模型能够大幅提升企业生产力、驱动业务创新和增长，企业实现大模型部署

#人工智能 #odps #大数据 +1

1374 

17 
阿里云大数据AI技术来自 2048 AI社区

2048ai.net · 2025-08-20 16:05:33

ODPS 十五周年实录 | 为 AI 而生的数据平台

本文根据ODPS十五周年·年度升级发布实录整理而成。

#odps #人工智能 #大数据

679 

13 
XueminXu 来自天启AI社区

tianqi.csdn.net · 2024-02-04 16:00:02

Python读取文件并写入到MaxCompute表

使用Python，或者使用DataWorks创建PyODPS3节点，读取FTP或者远程FTP文件，然后写入到MaxCompute指定表的分区中。

#python #odps #pandas

1151 

1 
冧_恣来自天启AI社区

tianqi.csdn.net · 2021-12-23 14:49:17

python连接阿里云ODPS，进行基本操作

安装指南 — PyODPS 0.10.7.1 文档from odps import ODPSo = ODPS(access_id='user', #登陆账号secret_access_key='password', #登陆密码project='project', #odps上的项目名称endpoint='http://service.cn-hangzhou-xxx:80/api') #官方提供的接

#阿里云 #odps #数据库

5738 

1 
王义凯_Rick 来自 DAMO开发者矩阵

damodev.csdn.net · 2022-07-14 01:03:29

Hive/MaxCompute SQL性能优化(一)：什么是数据倾斜

数据倾斜是指在并行计算模式下（map-reduce框架，数据被切分为N个片段，分发到不同的计算节点上，单独计算），部分节点处理的数据量远大于其他节点，造成该节点计算压力过大，从而导致少数节点的运行时长远远超过其他节点的平均运行时长，进而影响整体任务产出时效，造成任务延迟，这个现象就是数据倾斜。...

#hive #odps #性能优化

1377 

1 
赵渝强老师来自 DAMO开发者矩阵

damodev.csdn.net · 2025-07-28 08:04:19

【赵渝强老师】阿里云大数据存储计算服务：MaxCompute

随着数据收集手段不断丰富，行业数据大量积累，数据规模已增长到了传统软件行业无法承载的海量数据（TB、PB、EB）级别。MaxCompute致力于批量结构化数据的存储和计算，提供海量数据仓库的解决方案及分析建模服务。云原生大数据计算服务（MaxCompute）是一种快速、完全托管的TB/PB级数据仓库解决方案。MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型，能够更快速

#大数据 #阿里云 #odps +2

943 

20 
Xin学数据来自永洪数据分析社区

yonghongtech.csdn.net · 2022-09-28 13:39:19

阿里云大数据实战记录3：MySQL迁移到ODPS SQL

最近在做一些业务宽表的迁移，因为一个比较老的数仓示例已基本已弃用。该仓库为了快速响应数据需求，采用简单模式，没分开发环境和生产环境，使用的查询语言是MySQL。而迁移的目标仓库是标准模式（开发生产分环境跑），使用的ODPS SQL。在迁移的过程中，经常遇到的报错问题就是关于数据类型不一致，一段几百行的SQL，报错，调试，定位到问题，修改好，重跑，又报错……改了又改，最终跑通之后，粗算一下时间，足足

#mysql #sql #odps +1

1751 

1 
LucianaiB 来自松山湖开发者村综合服务平台

community.sslcode.com.cn · 2025-07-12 22:08:34

AI 时代的分布式多模态数据处理实践：我的 ODPS 实践之旅、思考与展望

本文介绍了阿里云ODPS平台在多模态数据处理中的实践应用。通过MaxCompute的Object Table和MaxFrame技术，实现了高效的非结构化数据管理。文章详细演示了从环境部署到数据处理的完整流程，包括一键部署、DataWorks升级、MaxCompute项目绑定、OSS数据准备等关键步骤。同时分析了当前架构的技术优势（统一元数据管理、分布式计算等）和现存挑战（学习曲线陡峭、特殊格式支持

#人工智能 #分布式 #odps +2

8270 

55 
维克先生来自讯飞AI开发者社区

xfyun.csdn.net · 2023-01-13 15:42:53

阿里云 - MaxCompute研究

MaxCompute是适用于数据分析场景的企业级SaaS（Software as a Service）模式云数据仓库，提供离线和流式数据的接入，支持大规模数据计算及查询加速能力。MaxCompute适用于100 GB以上规模的存储及计算需求，最大可达EB级别，适用于大型互联网企业的数据仓库和BI分析、网站的日志分析、电子商务网站的交易分析、用户特征和兴趣挖掘等。

#阿里云 #odps #大数据

1615 

2 
lhxsir 来自讯飞AI开发者社区

xfyun.csdn.net · 2021-07-29 15:36:17

阿里云ODPS使用to_char()报错

执行SQL语句：select to_char(from_unixtime(cast(1622628854384/1000 as BIGINT)),'yyyymmdd');报错信息如下：FAILED: ODPS-0130071:[1,8] Semantic analysis exception - function to_char cannot match any overloaded functi

#odps

2566 

1 
烧酒与墨来自讯飞AI开发者社区

xfyun.csdn.net · 2024-03-15 15:54:46

Spark 读取阿里云 MaxCompute数据源写阿里云OSS和华为云OBS

前情提要：当前Spark 版本为2.4.5写数据到阿里云OSS1、编写Spark 代码 - 写OSSpublic class SparkODPS2OSS4 {public static void main(String[] args) {SparkSession spark = SparkSession.builder().appName("ODPS2OSS")// 可访问O

#spark #阿里云 #odps

2292 

41 
程序员维他命来自 DeepSeek技术社区

deepseek.csdn.net · 2025-03-12 11:31:14

大模型，潜力有多大？

将大模型“装”进手机、融入供应链，带到办公室和生产线……2024年以来，不少国产大模型已经踏上和实体产业相融合的新赛道，加速多场景落地。今年《政府工作报告》明确指出，持续推进 “人工智能＋”行动，将数字技术与制造优势、市场优势更好结合起来，支持大模型广泛应用，大力发展智能网联新能源汽车、人工智能手机和电脑、智能机器人等新一代智能终端以及智能制造装备。“支持大模型广泛应用”首次被写入《政府工作报告》

#人工智能 #odps #大数据 +1

948 

24 
老板,我要写光所有SQL 来自 DAMO开发者矩阵

damodev.csdn.net · 2022-09-28 15:30:31

SQL实现一行数据分组后转多行多列

通过聚合拆分再聚合的方式实现一行数据变分组的多行多列

#数据库 #hive #odps +2

3054 
tingmailang 来自讯飞AI开发者社区

xfyun.csdn.net · 2024-12-04 09:37:49

大数据（一）MaxCompute

作者后面会使用MaxCompute，所以在进行学习研究，总会有一些疑问产生，这里讲讲作者的疑问和思路

#odps #学习 #大数据

3363 

18 
不凡的房间来自讯飞AI开发者社区

xfyun.csdn.net · 2022-04-28 16:30:01

阿里云Dataworks日期调度

[yyyy-mm-dd] 表示今天{yyyy-mm-dd} 表示昨天[yyyy-mm-dd-1] 表示昨天{yyyy-mm-dd-1} 表示前天{yyyy-mm-dd-1/48} 表示前天，{}日期调度参数不支持用-1/24、-1/48这些[yyyy-mm-dd-1/48] 表示今天定时时间的前半小时，支持用-1/24、-1/48这些...

#big data #sql #数据仓库 +2

1442 

1 
LCLDeer 来自讯飞AI开发者社区

xfyun.csdn.net · 2023-11-22 11:19:39

阿里云DataWorks--odps常见报错及解决方案

阿里云常见报错及解决方案

#阿里云 #odps

6867 

1 
floret* 来自讯飞AI开发者社区

xfyun.csdn.net · 2024-10-12 09:49:21

阿里云（FAILED: ODPS-0130071:[12,1] Semantic analysis exception - column view_count in source has incom）

可以看出是由于数据类型导致的，这里count之后数据类型为bigint。有两种解决方案，一种是重新建表，数据类型为bigint。另一种是用cast进行数据类型的转换。在执行插入语句时，出现了如下错误。查看我们的建表时数据类型为int。

#odps #大数据 #数据仓库

1101 

12 
项羽bigdata 来自讯飞AI开发者社区

xfyun.csdn.net · 2023-01-06 10:45:07

ODPS是什么，阿里云ODPS前世今生

ODPS（OpenDataPlatformandService）是阿里云自研的一体化大数据智能计算平台，10余年来持续迭代，提供了实时离线一体、流批一体、湖仓一体、大数据+AI一体的多场景能力，是业界少有的完全自主研发，支持10万级服务器并行计算、百万级CPU可扩展大数据智能计算平台。

#大数据 #odps #数据仓库 +1

3902 

1 
qq_34142583 来自讯飞AI开发者社区

xfyun.csdn.net · 2022-09-10 10:26:00

阿里云 odps maxcompute max_pt 用法

一、简述select max_pt('tableName')对于分区的表，此函数返回该分区表的一级分区的最大值，按字母排序，且该分区下有对应的数据文件。说明：tableName：String 类型，指定表名(必须带上 project 名，例如：prj.src)，用户必须拥有该表的读权限。返回值：最大的一级分区的值。例：tab 是分区表，该表对应的分区如下，且都有数据文件。pt=‘200808...

#odps #数据库 #oracle +2

531 
≯不见猫来自永洪数据分析社区

yonghongtech.csdn.net · 2025-05-21 21:02:54

大数据计算服务MaxCompute -- 03 --SQL开发

文章目录 1. MaxCompute SQL 基础知识1.1 基础概念1.2 适用场景1.3 MaxCompute与Mysql的差异1.4 MaxCompute 数据类型 2. MaxCompute SQL DDL2.1 表操作-创建/删除2.2 快捷建表操作 CTAS2.3 生命周期2.4 分区操作 Partition2.5 修改表属性 ALTER TABLE2.6 视图操作 VIEW2.7

#大数据 #odps #sql

1033 

6 
孙行者Monkey 来自 2048 AI社区

2048ai.net · 2020-12-01 15:26:41

实用 | Dataworks的使用详细说明

一、开通Dataworks（1）百度搜Dataworks，进入如下页面，点击立即开通（2）这里要选好自己想要的配置，这里展示我之前的配置解决方案：选DataWorks+MaxCompute组合产品DataWorks：标准版购买时长：1年MaxCompute：按量付费（3）开通好之后，进入Dataworks的控制台，点击dataworks首页二、进入dataworks首页三、数据开发（1）点击数据

#大数据 #odps

1w 

18 
weixin_51754359 来自 2048 AI社区

2048ai.net · 2020-11-16 11:35:01

DataWorks中MaxCompute的常用操作命令

原文链接：https://blog.csdn.net/yitian_z/article/details/90729172案例：本文主要描述阿里云数据处理平台DataWorks中MaxCompute常用操作命令一、表操作（1）删除表：DROP TABLE [IF EXISTS] table_name;1、如果不指定if exists选项而表不存在，则返回异常。若指定此选项，无论表是否存在，皆返回成功

#odps

6927 

3 

标签介绍

odps

——odps

热门标签

关于我们

联系我们（工作时间：8:30-22:00）

400-660-0108 kefu@csdn.net