logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

彻底搞懂深度学习-强化学习和智能体(动图讲解)

本文探讨了强化学习与智能体的区别及联系。强化学习是一种通过试错和反馈来优化决策的方法论,而智能体则是一个完整的自主系统架构。两者可独立存在,也可结合形成强化学习智能体。随着大语言模型的发展,出现了基于LLM的新型智能体,它以语言为通用接口,主要分为对话式、任务导向型和多智能体协作系统三种模式。传统智能体和LLM智能体各有优势,适用于不同场景:前者适合精确控制和实时反应,后者擅长自然语言交互和快速开

文章图片
#深度学习#人工智能#AI
如何在2024年从头开始学人工智能?AI学习完整指南:Python基础、机器学习、深度学习

AI 或人工智能是计算机科学的一个分支,专注于创建可以执行通常需要人类智能的任务的系统。这些任务包括理解自然语言、识别模式、做出决策和从经验中学习。AI 是一个广阔的领域,包含众多子领域,每个子领域都有其独特的目标和专长。

文章图片
#人工智能#学习#机器学习 +2
自动驾驶必学:基于深度学习的车道线检测:原理、技术与应用

基于深度学习的车道线检测已从实验室研究走向实际应用,但仍需在鲁棒性、实时性和泛化能力上持续突破。随着自动驾驶技术的发展,车道线检测将与更多环境感知技术融合,成为智能驾驶系统的关键基础模块。有以下论文写作问题的可以扫下方名片详聊前沿顶会、期刊论文、综述文献浩如烟海,不知道学习路径,无从下手?没时间读、不敢读、不愿读、读得少、读不懂、读不下去、读不透彻一篇完整的论文?CVPR、ICCV、ECCV、IC

文章图片
#深度学习#计算机视觉#人工智能 +1
一文搞懂李飞飞的空间智能(世界模型)

AI教母李飞飞指出当前大语言模型(LLM)存在根本局限——缺乏对物理世界的"根基"理解,只是"能言善辩的瞎子"。她提出的"空间智能"旨在为AI构建"世界模型",使其真正理解三维空间的物理规律。这种能力包含三大核心:生成性(创建符合物理规则的3D环境)、多模态(处理多种输入输出形式)和交互性(模拟"感知-行动&

文章图片
#人工智能#计算机视觉
监督微调SFT vs 强化学习训练RLHF

摘要:本文探讨了大语言模型(LLM)的两种主要训练范式:监督微调(SFT)和强化学习(RL)。SFT通过特定领域数据优化模型输出,适用于机器翻译、情感分析等生成性任务;RL则通过奖励机制引导模型符合人类偏好,适用于评分、排序等任务。文章详细比较了两者的任务定义、适用场景、训练数据和方法,并介绍了PPO、DPO等常用RL算法。这些方法共同构成了从预训练到企业级落地的完整AI模型优化路径。

文章图片
#人工智能#算法#机器学习
大模型算法工程师月薪5W!!2026 AI人才趋势全解析!抓住AI时代的个人新机会!

AI人才需求爆发式增长,大模型算法岗月薪可达5.2万。2023年AI应用元年开启后,近60%高科技企业将AI人才视为核心招聘指标。调研显示,企业更看重实际项目经验(52.5%)和算法基础(60.3%),名校学历(28.8%)重要性下降。技术研发类岗位薪酬显著高于非技术岗,约58%企业计划扩招AI人才。AI正从技术能力向业务能力转化,复合型人才和具备持续学习能力者更具竞争力。建议求职者注重培养创造力

文章图片
#人工智能#深度学习
NeurIPS满分论文来了!

摘要:清华大学与上海交通大学联合团队在NeurIPS2025发表满分论文,颠覆性指出基座模型本身而非强化学习(RLVR)决定大模型推理上限。研究通过pass@k指标对比实验发现,RLVR仅优化底模已有能力而非扩展新能力,且蒸馏方法更具进化潜力。该结论对当前主流RLVR技术路径提出挑战,引发对相关领域投入方向的重新思考。论文采用多基准测试验证,团队包含清华LeapLab多名优秀研究者。作者强调该发现

文章图片
#人工智能#深度学习#计算机视觉
NeurIPS满分论文来了!

摘要:清华大学与上海交通大学联合团队在NeurIPS2025发表满分论文,颠覆性指出基座模型本身而非强化学习(RLVR)决定大模型推理上限。研究通过pass@k指标对比实验发现,RLVR仅优化底模已有能力而非扩展新能力,且蒸馏方法更具进化潜力。该结论对当前主流RLVR技术路径提出挑战,引发对相关领域投入方向的重新思考。论文采用多基准测试验证,团队包含清华LeapLab多名优秀研究者。作者强调该发现

文章图片
#人工智能#深度学习#计算机视觉
使用ppo算法解决两足机器人的步行问题,该从什么开始学呢?

通过以上步骤,从基础理论到实践案例,逐步掌握使用PPO算法解决两足机器人步行问题的关键技术和实现方法。结合仿真平台和现有工具,进行实践操作,进一步深化理解和应用能力。2024年零基础AI学习路线部分新增内容。

文章图片
#深度学习#人工智能#机器学习 +2
万字拆解:Agent 到底是什么? 有哪些使用场景

摘要:Agent(智能体)正从被动应答转向主动执行,重塑人机协作方式。其核心由四大组件构成:大脑(LLM)负责决策、技能(Tools)实现行动、记忆(Memory)保持连贯性、规划(Planning)拆解任务。文章详细阐述了Agent在产品研发、运营增长、客户服务和企业流程中的落地场景,通过自动化PRD生成、智能客服、跨系统协同等应用实现效率提升。同时指出当前存在成本、可靠性、安全性和维护复杂度等

文章图片
#人工智能#深度学习
    共 186 条
  • 1
  • 2
  • 3
  • 19
  • 请选择