logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Apache Doris 4.0 的 AI 功能(LLM 函数 + 向量索引)与 Cloudera CDP 7.3(或类 CDP 的 CMP 7.13 平台,如华为鲲鹏 ARM 版)融合

摘要:Apache Doris 4.0与Cloudera CDP 7.3(或类CMP平台)可通过架构协同实现AI数据平台融合。CDP作为数据湖底座负责存储治理,Doris 4.0提供LLM函数和向量索引等AI分析能力,二者通过Hive Catalog实现元数据互通,Spark/Flink Connector完成数据同步。在Kerberos环境下需配置安全认证,建议独立部署而非打包为Parcel。该

文章图片
#flink#hdfs#cloudera +4
Hadoop 与AI大模型实战:从Hive、Impala(Cloudera CDH、CDP)海量数据到 AI 决策的落地方法

摘要:本文提出从Hadoop数据湖(Hive/Impala)到AI决策的落地方法,采用四步走策略:1)构建统一数据底座,确保数据质量;2)建立可复用特征工程体系;3)实现模型训练与评估自动化;4)部署低延迟推理服务。重点强调特征一致性、闭环反馈机制和业务场景落地,建议从高价值场景入手,避免"大而全"方案。通过将传统大数据平台与现代AI工程结合,可低成本构建持续进化的智能决策系统

文章图片
#人工智能#cloudera#arm开发 +4
银河麒麟 V11(AI 增强版)安装华为昇腾300I Duo卡部署Qwen大模型,Cloudera CDP 7.3(或类 CDP 的 CMP 7.13 平台,如华为鲲鹏 ARM 版)操作指南和脚本

本文详细介绍了在银河麒麟高级服务器操作系统V11(AI增强版)上部署华为昇腾Atlas300IDuo推理卡及Qwen系列大模型的完整流程。主要内容包括:硬件要求和软件环境准备、昇腾驱动与固件安装、MindIE推理环境配置、模型下载与配置调整、容器化部署方法,以及测试API接口等关键步骤。同时,文章还概述了银河麒麟V11系统的AI功能特性,包括智能算力调度、安全防护体系、国产AI硬件适配等核心竞争力

#人工智能#华为#cloudera +4
Cloudera CDH5|CDH6|CDP7.1.7|CDP7.3|CMP 7.3的产品优势分析(在华为鲲鹏 ARM 麒麟KylinOS、统信UOS)

Cloudera CMP7.3企业级大数据平台优势分析:该平台提供全栈式数据处理能力,覆盖批处理、实时流处理及AI集成;具备统一安全治理体系,满足国内外合规要求;采用高可用架构,支持HDFS+Ozone双存储引擎;提供图形化运维管理工具。特别在信创适配方面,通过鲲鹏ARM优化实现国产化支持,适配麒麟OS、统信UOS等系统,性能提升超50%。平台兼容开源生态,支持云服务集成,实现"一个平台

文章图片
#cloudera#大数据#深度学习 +4
Cloud Data AI 与人工智能(AI)联合解决方案(类ClouderaCDP7.3(404次编译) )完全支持华为鲲鹏Aarch64(ARM)

Cloud Data AICMP 本身并非一个 AI 框架,但它为 AI/ML 工作流提供了坚实的数据基础和平台支持,是实现企业级 AI 的关键基础设施。Cloud Data AICMP 与 AI 的联合,不是简单的功能叠加,而是“数据基石”与“智能引擎”的深度融合。问题,而 AI 则为 CMP 中的海量数据赋予了洞察和预测能力。的组织而言,基于 CMP 构建 AI 解决方案是一个成熟且可靠的选择

文章图片
#cloudera#大数据#hadoop +4
Iceberg在Hadoop集群使用步骤(适配AI大模型)

摘要:本文详细介绍了在Cloudera Data Platform(CDP)集群中使用Apache Iceberg的完整步骤。主要内容包括:环境要求(CDP 7.1.7+版本、Spark3.x)、通过Cloudera Manager配置Spark启用Iceberg支持、使用SparkSQL创建和管理Iceberg表、数据操作(增删改查/TimeTravel)、表结构变更等核心功能。同时说明了Ice

文章图片
#hadoop#大数据#分布式 +4
Iceberg 在hadoop大数据数据湖领域这么火

摘要:Apache Iceberg因其解决Hive表的核心痛点而成为数据湖领域的热门技术。它通过独立元数据存储、完整ACID事务支持和灵活分区管理,有效应对HDFS依赖和并发写入问题。Iceberg还满足AI时代的数据需求,如时间旅行和增量读取,并支持云原生架构和多引擎兼容。其企业级功能包括高性能查询和数据治理,且拥有强大的开源生态与巨头背书。作为中立开放的表格式,Iceberg既兼容Hadoop

文章图片
#大数据#hadoop#分布式 +4
Transformer的工作原理

Transformer是一种基于注意力机制的深度学习模型架构,由Google在2017年提出。它抛弃传统RNN/CNN结构,采用自注意力和前馈网络,实现高度并行化和全局依赖建模。核心组件包括输入表示、多头自注意力机制和位置编码。Encoder-Decoder结构支持多种任务,其中Decoder使用掩码防止信息泄露。Transformer的优势在于并行化处理、长程依赖建模和强大的可扩展性,成为GPT

文章图片
#transformer#深度学习#人工智能
2025年AI时代Impala、Hive、Spark、Flink组件在“数据中台BI”出路,建议由CDH迁移到CMP 7.13 平台(类Cloudera CDP,如华为鲲鹏 ARM 版)

2025年AI时代数据中台BI技术转型建议:随着AI原生、大模型驱动的自然语言交互(NLQ)和实时决策成为主流,Hadoop生态组件需从传统SQL引擎转型为智能数据服务支撑层。Hive应聚焦元数据治理,成为可信数据注册中心;Impala适用于高安全私有化场景的高性能查询;Spark作为通用计算基座,支撑语义层与AI集成;Flink则专精实时BI与智能决策。建议企业将CDH平台迁移至CMP7.13类

文章图片
#人工智能#cloudera#arm开发 +4
CMP(类ClouderaCDP7.3(404次编译) )完全支持华为鲲鹏Aarch64(ARM)使用 AI 优化库存水平、配送路线的具体案例及说明

本身是一个企业级数据湖仓平台,提供数据集成、数据治理、安全、机器学习和分析能力。它并不直接“使用 AI”来自动优化库存或配送路线,而是。⚠️ 注意:具体实施需结合企业 IT 架构和业务流程,通常由 Cloud Data AI 合作伙伴或内部数据科学团队完成。这类应用常见于零售、制造、物流行业客户,是 Cloud Data AI 在。通过预测需求,动态调整各门店/仓库的安全库存水平,实现“按需备货”

文章图片
#人工智能#机器学习#cloudera +4
    共 83 条
  • 1
  • 2
  • 3
  • 9
  • 请选择