logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

蚂蚁数据12月大事件 | Apache HoraeDB 发布 2.0.0 版本,DB for AI 成都站顺利召开...

✨ DB-GPT V0.6.3 版本更新:支持 SiliconCloud 模型、新增知识处理工作流支持 SiliconCloud 模型,让用户体验多模型的管理能力新增知识处理工作流,支持Embedding加工,知识图谱加工,混合知识加工处理ChatData 场景支持 OceanBase 向量可视化GraphRAG 社区总结优化,通过并行总结抽取提升索引构建性能ChatData 针对大宽表场景进行S

文章图片
#数据库#人工智能#大数据
在 Ray Data 和 Ray Serve 中推出原生 LLM API

https://www.anyscale.com/blog/llm-apis-ray-data-serve 译文2025年4月2日,我们激动地宣布在 Ray Data 和 Ray Serve 中为 LLM 推理提供原生 API。随着 LLM 在现代 AI 基础设施部署中变得越来越核心,平台需要能够高效地部署和扩展这些模型。虽然 Ray Data 和 Ray Serve 很适合快速部署和扩展这些模型

文章图片
#人工智能#算法#数据库 +2
使用Ray进行大规模并行智能体仿真

本文展示了如何借助 Ray 实现大规模智能体仿真,以生成智能体轨迹、评估智能体性能并训练智能体。

文章图片
#开源#架构#人工智能
万字长文详解|DLRover LLM Agent:大模型驱动的高效集群资源调优

本文介绍了DLRover LLM Agent,展示了基于 LLM 上下文学习能力的优化算法设计理念以及在DLRover 资源调优上的应用方法和效果。

文章图片
#数据库架构#大数据#数据库 +2
大模型存储的 “最后一公里” :蚂蚁大模型存储加速系统 PCache 如何解决万亿参数训练难题?

本文尝试通过当前学术和工业界在大模型存储领域的关注点和相关工作,并结合蚂蚁大模型训练场景实际的需求和问题,来介绍蚂蚁是如何在多云环境里构建一套具备高可用性、高性能以及低成本的云原生 AI 存储加速系统 PCache;并通过该存储方案在蚂蚁支持了百亿文件规模的多模态和万亿参数的 MOE 训练任务。

文章图片
#数据库#人工智能#大数据 +1
官宣:Ray 正式加入 PyTorch 基金会

https://www.anyscale.com/blog/ray-by-anyscale-joins-pytorch-foundation 译文

#pytorch#人工智能#python +2
OpenSPG/KAG 0.8发布:可配置知识库索引 x 拥抱接入MCP x 系统接口完善,多跳问答效果持续领先

我们正式发布KAG 0.8版本,本次更新旨在持续提升大模型利用知识库推理问答的一致性、严谨性和精准性,并引入了多项重要功能特性。首先,我们升级了KAG 知识库的能力。扩展了私域知识库(含结构化、非结构化数据)、公网知识库 两种模式,支持通过MCP 协议引入LBS、WebSearch 等公网数据源。

文章图片
#人工智能#网络#大数据 +3
大模型推理显存优化系列(3):FlowMLA——面向高吞吐的DP MLA零冗余显存优化

本文将介绍蚂蚁集团ASystem团队在推理显存优化上的新工作FlowMLA

文章图片
#语言模型#开源#数据库 +1
    共 48 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择