logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型训练推理优化(5): FlexLink —— NVLink 带宽无损提升27%

本期我们将介绍蚂蚁集团ASystem团队在大模型通信优化上的新工作FlexLink,旨在通过动态聚合多路通信(NVLink,PCIe,RDMA),在H800等典型硬件上将典型通信算子如(AllReduce, All Gather)吞吐提升最高达27%,尤其适合大模型长序列推理(Prefill阶段),及训练等通信密集的带宽bound场景。多通道并发传输:聚合NVLink,PCIe,RDMA网卡等多个

文章图片
#php#服务器#网络 +4
DB-GPT V0.8.0 版本更新|范式跃迁:AI + Data 驱动的数据分析交互体验升级

一次从“对话问答”到“任务交付”的范式跃迁,从「被动问答」到「自主分析」,探索真正的 Agentic 生产力。🎯 业务目标 → 🧠 任务拆解 → 🧩 技能调用 → 💻 代码生成(SQL/Python) → 🛡️ 沙箱执行 → 📊 图表生成 → 📝 报告交付你不再需要知道数据存在哪张表里,也不必为中间的数据清洗编写 Python 脚本。你只需要给出业务目标,DB-GPT AI数据助理

#人工智能#大数据#数据库 +2
破解AI“机器味“困境:HeartBench评测实践详解

2025年起,大模型的竞争格局正在发生微妙而深刻的变化。单纯的 Scaling Law已开始遭遇边际效应递减。在AI应用落地场景(如AI陪伴、创意写作、心理咨询等),我们正普遍面临模型虽具备逻辑,却有着明显的“机器味”,缺乏真正“人味儿”的困境。这种“人味儿”的缺失,不仅限制了AI的实用性,更直接影响了用户体验和产品的核心价值。它预示着:技术指标的军备竞赛之后,下一个战场已不再是单纯的智力比拼。

#人工智能#大数据#机器学习 +3
万字长文详解|蚂蚁数据湖深度探索与业务应用实践

万字长文带你深入广告场景Paimon+Flink全链路探索与最佳业务实践

文章图片
#大数据#数据库#人工智能 +2
DB-GPT 0.7.5 版本更新:基于 Falcon 评测集的Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

在ES支持向量检索的基础上,新增全文检索能力,提升RAG的检索召回能力。扩展Neo4j 数据库,进一步提升 RAG在复杂知识关系处理上的能力。V0.7.5 版本新增。

#大数据#开源#人工智能 +1
蚂蚁数据12月大事件 | Apache HoraeDB 发布 2.0.0 版本,DB for AI 成都站顺利召开...

✨ DB-GPT V0.6.3 版本更新:支持 SiliconCloud 模型、新增知识处理工作流支持 SiliconCloud 模型,让用户体验多模型的管理能力新增知识处理工作流,支持Embedding加工,知识图谱加工,混合知识加工处理ChatData 场景支持 OceanBase 向量可视化GraphRAG 社区总结优化,通过并行总结抽取提升索引构建性能ChatData 针对大宽表场景进行S

文章图片
#数据库#人工智能#大数据
在 Ray Data 和 Ray Serve 中推出原生 LLM API

https://www.anyscale.com/blog/llm-apis-ray-data-serve 译文2025年4月2日,我们激动地宣布在 Ray Data 和 Ray Serve 中为 LLM 推理提供原生 API。随着 LLM 在现代 AI 基础设施部署中变得越来越核心,平台需要能够高效地部署和扩展这些模型。虽然 Ray Data 和 Ray Serve 很适合快速部署和扩展这些模型

文章图片
#人工智能#算法#数据库 +2
使用Ray进行大规模并行智能体仿真

本文展示了如何借助 Ray 实现大规模智能体仿真,以生成智能体轨迹、评估智能体性能并训练智能体。

文章图片
#开源#架构#人工智能
万字长文详解|DLRover LLM Agent:大模型驱动的高效集群资源调优

本文介绍了DLRover LLM Agent,展示了基于 LLM 上下文学习能力的优化算法设计理念以及在DLRover 资源调优上的应用方法和效果。

文章图片
#数据库架构#大数据#数据库 +2
    共 50 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择