
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
导读:面对海量多模态数据管理困境,思必驰通过构建以 Apache Doris 为核心的数据集平台,实现了数据从 “散、乱、滞” 到 “统、明、畅” 的转变。在关键场景中,存储占用下降 80%、查询 QPS 提升至 3w,不仅实现可量化的效率提升和成本优化,更系统化地提升了 AI 研发效率与模型质量。本文整理自 思必驰数据中台架构师魏凯君在 Doris Summit 2025 中的演讲内容,并以演讲
截至目前,灵犀科技基于 Apache Doris 建设的统一数据数据平台已上线并稳定运行,有效解决了数据孤岛问题,实现了数据整合与流通。在数据集成(ETL)、标准化、治理和可视化等方面取得显著进展,相较于原有的多组件架构,数据生产能力提升超过 10 倍、存储成本节省超 60%。存算分离:进一步提升资源的利用率,精细化分配存储和计算资源。大模型 BI:将 Apache Doris 作为公司智能问答大

随着大模型和多模态 AI 的快速发展,向量已成为文本、图像、音视频等多元数据的通用语义表示。在这种背景下,检索增强生成(RAG)技术成为连接私有知识与大模型的核心桥梁,而高效的向量检索则是其关键支柱。与将向量检索视为独立外挂服务的方案不同,Apache Doris 4.0 选择将向量检索能力深度集成于其 MPP 分析型数据库内核。实现向量检索与 SQL 计算、实时分析和事务保障的无缝融合。本文旨在

上海证券引入 SelectDB 作为核心实时分析引擎,有效弥补了实时数据处理与分析的能力短板,实现湖仓一体与流批一体,同时替换了原架构中的 Elasticsearch 组件。达成了写入性能提升 4 倍,支撑 1000+ QPS 高并发访问,关键决策响应速度 200 ms,开发效率提升 50%,运维成本大幅降低的关键收益。

多租户 SaaS(customer_a_token → database_a 完全隔离)、高可用环境零停机配置更新、安全敏感组织的企业级权限管控。🚀 Doris MCP Server v0.6.0,开启企业级数据平台与认证管理新时代!本次升级完全向后兼容 v0.5.x,现有 API 和配置无需修改,可平滑升级。Doris MCP Server v0.6.0 正式发布!
借助AI_AGG与EMBED函数,Apache Doris 拥有了了强大的智能分析能力,极大地拓展了数据分析与智能应用的边界。AI_AGG通过其动态预聚合机制,将非结构化文本的智能聚合分析带入数据库,轻松应对海量用户评论、日志分析等场景。而EMBED函数则与 Doris 的向量函数无缝集成,提供从文本到语义向量、再到相似度检索的一站式解决方案,极大简化了问答系统、内容推荐等应用的开发。

导读:网易游戏引入升级架构,先是替换 Elasticsearch、Hbase、Clickhouse 构建了实时数仓,而后基于 Apache Doris 和 Iceberg 构建了湖仓融合架构,实现架构的大幅简化及统一。目前,网易游戏 Apache Doris 集群超 20 个 ,总节点数百个,已对接内部 200+ 项目,日均查询量超过 1500 万,总存储数据量 PB 级别。近年来,随着网易游戏品

摘要: AI时代对数据仓库提出更高要求,需支持高并发、低延迟查询以满足智能体分析需求。Apache Doris 4.0凭借多项优化技术(数据裁剪、Pipeline执行引擎、向量化处理)在SSB-FLAT、SSB和TPC-H基准测试中表现卓越,查询吞吐量(QPS)显著领先Snowflake和ClickHouse,最高达7.39倍。其能力源于高效的数据过滤、并行执行架构及SIMD加速,成为AI时代理想

在如 Snowflake、ElasticSearch、ClickHouse.... 等传统系统中,对于 JSON 的处理往往面临灵活性及性能无法兼得的困境,而 Apache Doris 的 VARIANT 类型,通过动态子列、稀疏列存储、延迟物化和路径索引等能力,实现了灵活结构 + 列存性能的平衡。本文将对该能力的实现一一讲解,全面展示其优势。

近日,Doris MCP Server 0.5.1 版本带来了多项企业级数据治理与分析能力的功能升级,进一步提升系统稳定性与易用性,欢迎下载体验。项目地址:https://github.com/apache/doris-mcp-server。








