logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

全球首个超声多模态大模型!百度百舸支撑海豚智能实现高效训练与稳定服务

在百度百舸 · AI 计算平台的全方位支持下,Dolphin V1.0 成功上线。Dolphin V1.0 在胎儿标准切面识别上的准确率超过 90%,在乳腺病灶分型任务中准确率达到 86%。与上一代仅能执行单任务的专用模型相比,Dolphin 实现了“一模多能”的通用能力,模型复用效率显著提升。未来,海豚智能将不断深化与百度智能云的合作,基于百舸平台全周期的 AI 工程支持,持续训练、提升模型能力

#百度
百度智能云专有云 ABC Stack 平台通过一云多芯认证,为用户构建全栈国产化云平台

这一趋势,也给云平台带来了异构资源的统一管理调度、统一运维等挑战。在硬件方面,ABC Stack可实现多种芯片的统一调度,支持Intel、海光、鲲鹏、飞腾等CPU,以及昆仑、海光、昇腾、寒武纪等主流 GPU,并可实现和云平台中的AI加速组件协同,提升 AI 业务效率;这些能力,可以支撑用户复杂的应用场景,帮助客户构建全栈国产化云平台,并支撑客户业务平滑迁移,真正使客户「建好云,上好云,用好云」。百

文章图片
百度智能云千帆大模型平台引领企业创新增长

提供了最专业的应用开发工具、最丰富的大模型、最全面的工具链。千帆 ModelBuilder 提供的就是全流程的、模型训练和模型精调的工具链,包含:数据管理、训练模式、开发工具、评估优化、推理部署、大模型周边系统。除了智能体作为应用载体之外,还有非常多的企业级传统应用,过去是通过写代码的方式开发,今天我们通过大模型也实现了零代码分钟级开发,它就是 AI 速搭平台。今天我的发布到此结束,非常希望通过千

文章图片
#RAG#低代码
百度百舸 x 昆仑芯,加速 GLM-5.1 从开源发布到规模化应用

同时,在量化层面,百度百舸推出了「模型层 - 框架层 - 硬件层」的端到端的量化体系——通过昆仑芯自研量化工具链实现高精度、高效率的模型量化,对不同来源的 INT8 / INT4 量化模型实现最佳模型部署与量化推理,并基于昆仑芯 XPU 的计算特性,定制化开发高性能量化专用算子库。在适配效率上,基于昆仑芯成熟的高性能算子库,针对无新增算子的新模型(如从 GLM-5.0 版本迭代至 GLM-5.1)

#开源
从 CPU 到 GPU 全链路可信,百度智能云新一代 AI 机密计算实例的探索与落地

从 CPU 到多 GPU,从单点到全链路:百度智能云第 7 代 AI 机密虚拟机正式落地,让「数据可用不可见」真正成为云上高敏感业务的基础设施。全链路机密计算:CPU TDX + GPU CC + PPCIe 加密链路;多 GPU 弹性扩展:支持 NVLink / NVSwitch 高速互联;全资源售卖:DPU 卸载 I/O, CPU 资源完全交付;可信验证:TDX + GPU CC 双重远程认证

#人工智能
拒绝 OpenClaw 成为「吞金龙虾」,百度百舸打造极致 KV Cache 调度与加速引擎

Agent 将大模型推理全面带入长上下文与多轮交互时代,百度百舸的 AttentionStore 让 KV Cache 从「短暂的显存数据结构」演进为「可持久、可调度、可规模化复用的系统资源」,通过对昆仑芯底层算力的深度调优与推理框架的无缝集成,我们成功实现了更优的 TTFT 响应与更低的成本开销,为大规模国产化算力落地构筑了坚实底座。

#dubbo#开发语言#算力
拒绝 OpenClaw 成为「吞金龙虾」,百度百舸打造极致 KV Cache 调度与加速引擎

同时,通过全生命周期锁页操作,避免 KV Cache 数据在传输过程中被换出,减少额外的内存拷贝与页错误开销,使数据能够以更稳定、更高带宽的方式直达显存。Agent 将大模型推理全面带入长上下文与多轮交互时代,百度百舸的 AttentionStore 让 KV Cache 从「短暂的显存数据结构」演进为「可持久、可调度、可规模化复用的系统资源」,通过对昆仑芯底层算力的深度调优与推理框架的无缝集成,

文章图片
超节点选型:跳出性能迷局,聚焦稳定与落地价值

在超节点这一创新算力形态的早期发展阶段,企业部署超节点时,不能唯性能论,否则极易陷入「高性能却难落地」的困境。唯有跳出性能迷局,聚焦超节点与业务场景的贴合度、与现有基础设施的兼容性,从性能转化、稳定性、可落地性多维度综合考量,才能让超节点真正落地,让高性能算力平稳转化为可持续的业务价值。

文章图片
唤醒 AI 算力,专有云 ABC Stack 面向企业级智算平台的 GPU 提效实践

基于百度在大规模集群的技术积累和工程实践,在向企业交付智算平台后,专有云 ABC Stack 还为客户提供了一套面向整体 GPU 算力平均利用率、训推任务加速和稳定性等场景的 GPU 提效服务。

文章图片
#人工智能
因熟知而忽视:底层系统里,藏着 20% 未被挖掘的算力成本

因此,如果希望继续挖掘性能与成本空间,视角就必须下移至——

#算力#性能优化
    共 95 条
  • 1
  • 2
  • 3
  • 10
  • 请选择