
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
运行单个渲染负载,使用的 GPUtest 的 Furmask 测试,分配 100% 算力,FPS 在 550。在结合用户态本身支持的抢占混布和分时混布,使得数据处理和模型开发等离线任务,可以和在线推理业务进行在离线混布,当在线业务处于波谷时,离线业务抢占较多 GPU 空闲资源进行业务处理,节省了整体的 GPU 使用数量。在没有使用 GPU 容器虚拟化方案之前,每个业务实例使用一个 GPU,通过大量

百度智能云混合云联合昆仑芯、HAMi(密瓜智能发起并主导的 CNCF 开源项目),正式推出基于昆仑芯 P800 的 XPU/vXPU 双模式算力调度方案 —— 该方案已率先在某金融客户的昆仑芯集群中落地,为智能客服、营销辅助等十余类 AI 业务提供兼具稳定性与灵活性的算力支撑。客户可在同一集群内灵活调用昆仑芯 P800 的整卡 XPU 与虚拟化 vXPU 资源,让国产算力既高效匹配业务需求,又实现

全球具身智能赛道迎来快速发展期,高质量数据开源与领先的 AI 基础设施等成为驱动行业突破的重要力量。百度百舸正携手具身智能产业的广大生态伙伴,共建开放、协同的产业生态,共同加速具身智能机器人的应用落地,推动机器人真正走进千行百业、千家万户。「RealOmni」数据集合下载地址:https://huggingface.co/datasets/genrobot2025/10Kh-RealOmin-Op
全球具身智能赛道迎来快速发展期,高质量数据开源与领先的 AI 基础设施等成为驱动行业突破的重要力量。百度百舸正携手具身智能产业的广大生态伙伴,共建开放、协同的产业生态,共同加速具身智能机器人的应用落地,推动机器人真正走进千行百业、千家万户。「RealOmni」数据集合下载地址:https://huggingface.co/datasets/genrobot2025/10Kh-RealOmin-Op
全球具身智能赛道迎来快速发展期,高质量数据开源与领先的 AI 基础设施等成为驱动行业突破的重要力量。百度百舸正携手具身智能产业的广大生态伙伴,共建开放、协同的产业生态,共同加速具身智能机器人的应用落地,推动机器人真正走进千行百业、千家万户。「RealOmni」数据集合下载地址:https://huggingface.co/datasets/genrobot2025/10Kh-RealOmin-Op
在异构计算方面,百度智能云提供支持多种异构芯片的计算产品,包括国际主流的 L20/H20 等 GPU,以及自研加速芯片等计算产品,面向推理和训练场景全面优化性能,最高配备 3.2T 的 RDMA 高速网络,实现算力和网络的最佳配比,形成形态丰富的异构算力矩阵。以容器产品为基础,全面加强云原生应用产品的企业级产品特性,简化运维复杂度,做到性能和稳定性的提升,覆盖应用部署、应用可观测和应用可运维的应用

此外,百度智能云联合信通院等共同启动了「一云多算生态共建计划」,并发布《一云多算综合技术能力要求》标准,共同推动以一朵云的方式将通用算力、超算、智能算力等多种资源池融合,提供统一调度、管理、运维运营等操作的技术能力。因在该标准制定过程中的突出贡献,百度智能云获评「一云多算标准最佳贡献单位」。会上,百度智能云混合云总经理杜海和中国信通院云大所所长何宝宏签署业务合作协议,未来中国信通院云大所和百度智能

【问题】长文本推理被「显存墙」卡住在 32K 至 128K 超长上下文场景中,DeepSeek-V3.2-Exp 的 Decode 阶段需维护一个随序列长度线性增长的 Latent Cache。更多详细内容,请阅读 ESS 技术报告全文:https://arxiv.org/abs/2512.10576。挑战:Latent Cache 仅 656 字节、访问离散,传统拷贝带宽 <1 GB/s。- P
部署 DeepSeek-V3.2-Exp 时,百度百舸团队发现其长上下文性能明显低于官方报告。经排查,问题源于官方开源的 Inference Demo 中 RoPE 排布方式的一处细微错配。修正后,DeepSeek-V3.2-Exp 性能完全恢复。本文完整记录了该问题从发现、验证与协同 DeepSeek 官方修复的全过程。
百度百舸 DeepSeek 一体机基于百度百舸平台打造,提供纯国产的算力组合,支持昆仑芯 P800 单机 8 卡部署满血版 DeepSeek R1/V3,支持 8bit 推理。企业可以将一体机部署在私有云环境中,从开箱上电到服务上线最快仅需半天。








