
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
地平线HSD全场景辅助驾驶系统采用强化学习架构,在感知到控制时延压缩至行业新低,展示了强化学习在智能驾驶领域的应用潜力。随着技术的不断发展,强化学习将在智能驾驶领域发挥越来越重要的作用,为未来交通出行提供更加安全、便捷、舒适的体验。# 强化学习驱动智能驾驶:地平线HSD技术革新解析地平线HSD全场景辅助驾驶系统采用强化学习架构,在感知到控制时延压缩至行业新低,展示了强化学习在智能驾驶领域的应用潜力
在机器学习或者深度学习中,都有一个任务目标,例如猫狗分类准确率、回归预测损失最小化等,为了达到的目标,通常都会训练一个单一的(大)模型或者一系列模型(集成学习),然后根据的目标不断的对模型进行调优,直到达到目标。这种方式一般能够满足的需求,但这种方式让专注于单一的任务目标,可能忽略了一些相关的信息,而这些信息可能会促使更容易甚至达到更优的目标值。换句话就是,通过相关任务之间的共享表示,让的模型对原
有趣的github项目分享,开源
赤兔」通过结合高效的 Token 分发策略(AllGather, DeepEP, NPU 融合通信)和优化的专家计算内核(Triton, DeepGEMM, NPU Kernel, 量化支持),为 MoE 模型的高性能推理提供了强大的支持。其自动选择最优策略和实现的能力,以及对 Prefill 和 Decode 阶段的分别优化,是其在处理复杂 MoE 模型时保持领先性能的关键。# 「赤兔」Chit
昇腾AI创新大赛华东区展示了基于昇腾AI平台的创新成果,为智能分选和智慧工地等领域带来了新的技术解决方案。随着AI技术的不断发展,我们有理由相信,这些创新技术将在未来发挥越来越重要的作用,推动产业升级和社会进步。# 昇腾AI创新大赛华东区:智能分选与智慧工地,技术革新看这里昇腾AI创新大赛华东区展示了基于昇腾AI平台的创新成果,为智能分选和智慧工地等领域带来了新的技术解决方案。随着AI技术的不断发
昇腾AI芯片是华为公司自主研发的一款高性能AI芯片,具备强大的计算能力和低功耗特性。昇腾AI芯片采用Ascend架构,支持多种深度学习框架,能够满足不同场景下的AI应用需求。昇腾AI创新大赛华东区域赛展示了基于昇腾AI技术的创新解决方案在多个行业的应用潜力。从工业制造到政法、物流,AI技术正逐渐改变着我们的生产生活方式。未来,随着AI技术的不断发展和完善,我们有理由相信,昇腾AI技术将在更多领域发
赤兔」Chitu 框架不仅在国际主流的 NVIDIA GPU 上表现出色,更以其前瞻性的战略布局和坚实的技术投入,在国产AI算力领域取得了令人瞩目的成就。通过提供对华为昇腾、海光 DCU、沐曦等芯片的完整适配和深度性能优化,「赤兔」成功地在这些国产平台上高效运行了 Qwen3、GLM-4.5 MoE 等 SOTA 大模型。它正在扮演一个至关重要的“连接器”角色,打通了上游先进模型与下游国产硬件之间
同时,通过公式 min(r(θ), clip(r(θ), 1-ε, 1+ε) 对新旧策略比率进行裁剪,巧妙地避免了过大的策略变化,使优化目标更加平滑。其中 r(θ) 表示新旧策略的概率比,ε 是一个超参数,限制了策略更新的幅度。也就是说,每次更新时,我们选择让 r(θ) 限制在 [1-ε, 1+ε] 这个区间内,防止策略跳跃式变化。对非专业人士而言,你可以这样理解:PPO 就像一位耐心的高尔夫教练

模型概要这是一个总结的模型可在Transformers。假设您熟悉最初的Transformers模型。或者温柔的介绍,看看有注释的Transformers。在我们关注模特之间的高度差异之前。你可以在他们各自的文件中,更详细地检查他们。查看 Model Hub,在这里可以根据模型体系结构查看checkpoints。Each one of the models in the library falls
对预先训练过的模特进行微调使用预先训练过的模型有很大的好处。它降低了计算成本,你的碳足印,并允许你使用最先进的模型,而不必从头开始训练一个。Transformer提供了数以千计的预先训练的模型,广泛的任务。当你使用一个预先训练好的模型时,你会在一个特定于你任务的数据集上训练它。他的作品被称为微调,一种非常强大的训练技巧。在本教程中,您将使用自己选择的深度学习框架对一个预先训练好的模型进行微调:微调







