logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Apache Doris AI 能力揭秘(四):HSAP 一体化混合搜索与分析架构全解

向量搜索通常需要在 “召回率、查询延迟、构建开销” 之间取得平衡,因此Doris 内置了两类主流 ANN 索引:HNSW 与 IVF。基于分层图结构,能够在搜索时快速从稀疏层缩小范围,并在底层进行精细查找。其优势包括:高召回率,在语义检索中接近精确搜索效果;低延迟,查询复杂度接近 O (log n),适合大规模场景;可调节精度,通过ef_search等参数动态控制召回率和延迟。HNSW 是业界应用

#apache#人工智能#架构
SelectDB x 同辕开发:在 ARM 架构下实现 25% 分析性能提升

飞轮科技旗下数据仓库SelectDB完成同辕开发深度适配,获鲲鹏Native认证,实现25%性能提升。测试显示,SelectDB在鲲鹏ARM平台单机环境下分析效率显著提高,兼容性表现优异。作为Apache Doris开源社区重要贡献者,飞轮科技自主研发的SelectDB已服务全球5000余家企业。未来将继续深化与鲲鹏生态合作,优化实时数据分析能力,助力企业数字化转型。

文章图片
#华为#arm#数据库
Apache Doris 4.0 AI 能力揭秘(二):为企业级应用而生的 AI 函数设计与实践

Apache Doris LLM Function 作为数据库技术与人工智能深度融合的创新实践,标志着数据分析领域向智能化方向演进的重要里程碑。通过将大语言模型能力原生集成到 SQL 执行引擎中,有效解决了传统数据分析架构中 AI 能力集成的技术挑战。从技术架构层面来看,LLM Function 采用资源池化管理和 SQL 原生集成的设计理念,实现了 AI 处理能力与数据查询的无缝融合。十大核心函

文章图片
#人工智能#apache#数据库
Apache Doris 4.0 AI 能力揭秘(二):为企业级应用而生的 AI 函数设计与实践

Apache Doris LLM Function 作为数据库技术与人工智能深度融合的创新实践,标志着数据分析领域向智能化方向演进的重要里程碑。通过将大语言模型能力原生集成到 SQL 执行引擎中,有效解决了传统数据分析架构中 AI 能力集成的技术挑战。从技术架构层面来看,LLM Function 采用资源池化管理和 SQL 原生集成的设计理念,实现了 AI 处理能力与数据查询的无缝融合。十大核心函

文章图片
#人工智能#apache#数据库
面向 Agent 的高并发分析:Doris vs. Snowflake vs. ClickHouse

摘要: AI时代对数据仓库提出更高要求,需支持高并发、低延迟查询以满足智能体分析需求。Apache Doris 4.0凭借多项优化技术(数据裁剪、Pipeline执行引擎、向量化处理)在SSB-FLAT、SSB和TPC-H基准测试中表现卓越,查询吞吐量(QPS)显著领先Snowflake和ClickHouse,最高达7.39倍。其能力源于高效的数据过滤、并行执行架构及SIMD加速,成为AI时代理想

文章图片
#人工智能#知识图谱#apache +2
面向 Agent 的高并发分析:Doris vs. Snowflake vs. ClickHouse

摘要: AI时代对数据仓库提出更高要求,需支持高并发、低延迟查询以满足智能体分析需求。Apache Doris 4.0凭借多项优化技术(数据裁剪、Pipeline执行引擎、向量化处理)在SSB-FLAT、SSB和TPC-H基准测试中表现卓越,查询吞吐量(QPS)显著领先Snowflake和ClickHouse,最高达7.39倍。其能力源于高效的数据过滤、并行执行架构及SIMD加速,成为AI时代理想

文章图片
#人工智能#知识图谱#apache +2
字节跳动:Apache Doris + AI 一站式融合数据引擎的探索与实践

随着人工智能技术在业务中的渗透,我们逐渐意识到:AI 不仅是提升效率的工具,更是重构数据处理与消费方式的核心驱动力。在这一背景下,我们思考:能否构建一款「AI + Data」一站式融合的数据引擎? 它不仅能够统一处理文本、音视频等非结构化数据与传统结构化数据,还能为算法工程师提供流畅的数据开发体验,实现数据处理与 AI 模型无缝衔接,并能确保数据处理负载与在线服务负载完全隔离。这是 2024 年末

文章图片
#人工智能
字节跳动:Apache Doris + AI 一站式融合数据引擎的探索与实践

随着人工智能技术在业务中的渗透,我们逐渐意识到:AI 不仅是提升效率的工具,更是重构数据处理与消费方式的核心驱动力。在这一背景下,我们思考:能否构建一款「AI + Data」一站式融合的数据引擎? 它不仅能够统一处理文本、音视频等非结构化数据与传统结构化数据,还能为算法工程师提供流畅的数据开发体验,实现数据处理与 AI 模型无缝衔接,并能确保数据处理负载与在线服务负载完全隔离。这是 2024 年末

文章图片
#人工智能
Apache Doris 中的 Data Trait:性能提速 2 倍的秘密武器

在数据库系统的核心层,查询优化器如同一位精明的策略家,不断分析数据特征并制定最优执行计划。Apache Doris 作为一款高性能的 MPP 分析型数据库,其优化器内置的 Data Trait 分析机制,通过挖掘数据内在的统计特征和语义约束,为查询优化提供了基础设施。让我们一起来探索这个强大的功能!

文章图片
#apache#知识图谱#人工智能
压缩率提升 48%,详解 Apache Doris 存储压缩优化之道|Deep Dive

在分析型数据库中,列式存储是压缩和查询性能的核心基础。它按列组织数据,同一列值类型一致且分布相似,为编码与压缩算法提供极高空间局部性和可预测性。当存储的值变化较小或重复频繁时,列式布局能够减少冗余存储,并提升向量化扫描的 CPU 效率。Apache Doris 作为一款典型的列式存储引擎,可独立存储每一列数据。导入时,每列数据写入近似固定大小的数据页,经过编码和压缩处理,以实现更紧凑的存储。在 D

#apache
    共 69 条
  • 1
  • 2
  • 3
  • 7
  • 请选择