
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
随着数据不断演进,尤其在 AI Agent、LLMOps 与可观测性系统快速发展的背景下,宽 JSON 的字段膨胀带来巨大的性能挑战。Apache Doris 4.1 通过 Doc Mode 与 Segment V3 实现了高效的存储与查询优化,使系统在写入吞吐、查询性能与资源开销之间保持良好平衡,其综合性价比优于 Clickhouse、PostgreSQL 等业界典型方案。随着业务持续演进(车型

顺丰科技引入 Doris 替换 Presto,在内部可视化数据自助分析工具丰景台场景广泛应用。目前,顺丰临时查询业务、丰景台报表业务的 Presto 场景已经 100% 切换到 Doris 集群中,日均查询量 100W+。并实现 P95 性能提升近 3 倍,硬件资源节省达 48% 显著收益。

随着大语言模型(LLM)的普及,检索增强生成(RAG)技术成为解决大模型知识时效性、准确性问题的核心方案,通过引入外部知识库,为模型提供实时、可控的上下文,从而提升回答的准确性与可解释性。然而,在实际落地过程中,RAG 的效果不仅取决于模型能力,更强地依赖底层数据系统的支撑能力。传统数据库或单一向量数据库,往往难以同时满足等多维需求,导致系统复杂度高、性能瓶颈明显。Apache Doris 作为一

1.1 新增 IVF 向量索引IVF 是大规模高维向量检索中最经典的 ANN 算法之一,核心思路是“先聚类分桶,再局部搜索”。相比 4.0 的 HNSW,IVF 可以在接受少量召回率损失的前提下,用更低的内存支撑更大规模的向量数据。
1.1 新增 IVF 向量索引IVF 是大规模高维向量检索中最经典的 ANN 算法之一,核心思路是“先聚类分桶,再局部搜索”。相比 4.0 的 HNSW,IVF 可以在接受少量召回率损失的前提下,用更低的内存支撑更大规模的向量数据。
导读:数据的爆发式增长与业务对实时性的极致追求,驱动易车技术团队在实时湖仓建设上持续探索。目前易车已基于 Apache Doris + Paimon + Hive 构建了湖仓一体化数据平台,实现架构收敛统一:**逐步替换 Druid、Kudu、HBase、MongoDB、ClickHouse 等近 10 种引擎。**广泛应用于实时多维分析、用户画像及标签体系、BI 报表(实时报表、仪表盘)等核心场

传统的日志分析方案,往往是一条数据同步链路连接着两个世界:Elasticsearch 负责搜索,OLAP 引擎负责分析。两套系统各自独立部署,存储冗余、运维复杂、版本升级相互牵制,数据一致性存在隐患。而 SelectDBsearch()的出现,让这一切变得简单起来。同一份数据,倒排索引负责筛选,MPP 引擎负责计算,搜索与分析在同一个引擎内无缝融合。search()集成了 15 种查询算子、BM2

像 PostgreSQL 和 MySQL 这样的 OLTP(在线事务处理)数据库,凭借其强一致性和高并发事务处理能力,已成为行业标准。为应对更大规模的工作负载,许多团队还会引入分库分表方案,将数据分布到多个实例和表中,以此突破单节点瓶颈。然而,这种对事务行之有效的方案,在实时分析需求(实时运营仪表盘、多维业务报告、用户行为分析和实时监控)面前却暴露出明显短板。问题的关键不在于将 PostgreSQ

在可观测性场景中,Elasticsearch 常受限于写入性能与高昂成本。在《可观测性方案怎么选?SelectDB vs Elasticsearch vs ClickHouse》一文中提到, 在云上日志服务中,SelectDB 相比 Elasticsearch 展现出明显的性能和成本优势。为进一步探索,本文通过基准测试对比二者表现,验证 SelectDB 在日志场景下性能与成本上的显著优势。

小米在 Apache Doris 和 Paimon 上的深度融合实践,是典型的数据库与数据湖的互补增效的体现。查询平均延迟从 60 秒降至 10 秒,性能提升 6 倍;高并发场景下(5 并发提高至 80 并发),查询延迟降低 25% 到 300%;整体查询并发能力达到 Presto 的 5 倍,有效减少了计算资源。目前,这些能力已经全部回馈到了 Apache Doris 社区。使用 Doris 全








