logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大语言模型引导深度强化学习,助力自动驾驶决策

(DRL) 在自动驾驶决策中展现出巨大的潜力。然而,由于 DRL 的学习效率低,因此需要大量的计算资源才能在复杂的驾驶场景中实现合格的策略。此外,利用人类专家的指导来提高 DRL 性能需要极高的劳动力成本,这限制它的实际应用。本研究提出一种大语言模型 (LLM) 引导的深度强化学习 (LGDRL) 框架来解决自动驾驶汽车的决策问题。在这个框架中,基于 LLM 的驾驶专家被集成到 DRL 中,为 D

文章图片
#语言模型#自动驾驶#人工智能 +2
别等被淘汰!AI 大模型红利期已至,程序员转型与求职必看

别等被淘汰!AI 大模型红利期已至,程序员转型与求职必看

文章图片
#人工智能#算法#深度学习
别等被淘汰!AI 大模型红利期已至,程序员转型与求职必看

别等被淘汰!AI 大模型红利期已至,程序员转型与求职必看

文章图片
#人工智能#算法#深度学习
干货|5 分钟搞懂:今年爆火的 Agent 智能体,到底是什么?

干货|5 分钟搞懂:今年爆火的 Agent 智能体,到底是什么?

文章图片
#人工智能#大数据#学习 +1
干货|5 分钟搞懂:今年爆火的 Agent 智能体,到底是什么?

干货|5 分钟搞懂:今年爆火的 Agent 智能体,到底是什么?

文章图片
#人工智能#大数据#学习 +1
干货|5 分钟搞懂:今年爆火的 Agent 智能体,到底是什么?

干货|5 分钟搞懂:今年爆火的 Agent 智能体,到底是什么?

文章图片
#人工智能#大数据#学习 +1
复旦大学 大规模语言模型:从理论到实践(第1版) 297页(免费下载)

围绕大规模语言模型(LLM)的技术体系展开,系统性地从理论构建到工程实践进行阐述。全书以“预训练—有监督微调—强化学习”为核心流程,贯穿理论推导与代码实践,既从数学层面解构注意力权重计算、损失函数优化等底层原理,又通过Deepspeed-Chat、LLaMA训练案例提供可复现的工程参考,形成从算法设计到集群训练、从微调优化到服务落地的完整技术链条。

文章图片
#语言模型#人工智能#自然语言处理 +2
ML 4大经典名著之一 李航《机器学习方法》pdf,字节AI实验室总监强推

《机器学习方法》这本书由李航博士撰写,他是字节跳动AI实验室的总监。这本书以其全面和系统的内容,成为了机器学习领域的经典之作。虽然它不是为初学者设计的,但对于任何希望在人工智能领域发展或进行科研工作的人来说,都是一本必读的书籍。书中内容精炼,不拖泥带水,从基础原理出发,为读者提供了清晰的理解。

文章图片
#人工智能#机器学习#大数据
35 岁程序员的 AI 奇遇:以为要被淘汰,结果靠它转型 Agent 架构师(附入门思路)

35 岁程序员的 AI 奇遇:以为要被淘汰,结果靠它转型 Agent 架构师(附入门思路)

文章图片
#人工智能#大数据#oracle +2
35 岁程序员的 AI 奇遇:以为要被淘汰,结果靠它转型 Agent 架构师(附入门思路)

35 岁程序员的 AI 奇遇:以为要被淘汰,结果靠它转型 Agent 架构师(附入门思路)

文章图片
#人工智能#大数据#oracle +2
    共 508 条
  • 1
  • 2
  • 3
  • 51
  • 请选择