logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习进阶(八)——AI 操作系统的雏形:AgentOS、Devin 与多智能体协作

AI正从单一模型向系统化协作演进。早期大模型追求规模与精度,但存在记忆、调度等局限,催生了AutoGPT等智能体框架。多智能体协作(如ChatDev)通过角色分工实现任务并发,采用结构化通信协议提升效率。Devin首创AI工程师系统,集成开发环境与记忆管理,形成感知-行动-反馈循环。AgentOS雏形显现,包含智能体调度、记忆存储等模块,类似操作系统管理语义进程。当前框架如LangChain侧重工

文章图片
#人工智能#深度学习
深度学习进阶(六)——世界模型与具身智能:AI的下一次跃迁

AI研究正从语言智能转向具身智能和世界模型,这是通向通用人工智能的关键路径。当前大语言模型虽能处理文本,但缺乏对物理世界的真实理解。世界模型通过编码器、动力学模型和解码器的闭环,让AI具备"内在模拟"能力,实现预测和规划。DeepMind的Dreamer系列和MuZero等突破表明,AI已能在"梦境"中学习策略。具身智能强调感知-行动闭环,使AI通过身体交互

文章图片
#人工智能#深度学习
深度学习进阶(五)——强化学习与决策智能:让模型学会行动

本文系统介绍了强化学习(RL)的核心概念与应用。从马尔可夫决策过程(MDP)到价值函数与策略优化,详细解析了动态规划、Q-learning、DQN、策略梯度及Actor-Critic等算法框架。重点探讨了现代RL算法PPO的原理及其在大模型RLHF(基于人类反馈的强化学习)中的关键作用,如ChatGPT的优化过程。同时指出RL面临的挑战(奖励设计、样本效率等)及未来发展方向(分层RL、世界模型等)

文章图片
#深度学习#人工智能#语言模型
深度学习进阶(七)——智能体的进化:从 LLM 到 AutoGPT 与 OpenDevin

AI智能体正从单纯的语言模型向具备自主行动能力的系统进化。2023年后,ChatGPT等模型展示了理解意图、制定计划的能力,催生了AIAgent研究。AutoGPT首次实现LLM自主分解任务、调用工具,OpenDevin则构建了更结构化的多模块系统。关键技术包括记忆系统、工具调用及规划反思能力,使AI具备持续意识和元认知。当前智能体正从模块化工具链向系统级AI演进,未来或将形成具备感知、推理、学习

文章图片
#深度学习#人工智能
通用类型Any的思想与实现

Any通用类型简介与实现 Any是一种类型擦除容器,能够存储任意类型的值并安全恢复原始类型。它解决了传统void*丢失类型信息的问题,避免了复杂的继承体系,适用于需要处理多种数据类型的场景(如服务器协议处理)。 核心特性: 类型擦除:统一接口存储不同类型 类型安全:运行时检查确保类型匹配 值语义:支持深拷贝和赋值操作 实现原理: 使用基类holder定义通用接口 模板子类placeholder存储

文章图片
#java#开发语言#人工智能 +4
见微知著——特征工程的科学与艺术

摘要:特征工程的科学与艺术进阶 本章深入探讨特征工程的高级技术,将原始数据提炼为高效特征集。主要内容包括: 特征交叉:通过手动或自动方式(如因子分解机、深度交叉网络)揭示特征间隐藏的交互模式,突破线性模型局限。 目标编码:针对高基数类别特征,用目标变量统计量进行编码,并采用留一法或K折交叉防止数据泄露。 实践工具:介绍scikit-learn的PolynomialFeatures和category

文章图片
#人工智能#机器学习#神经网络 +4
深度学习进阶(五)——强化学习与决策智能:让模型学会行动

本文系统介绍了强化学习(RL)的核心概念与应用。从马尔可夫决策过程(MDP)到价值函数与策略优化,详细解析了动态规划、Q-learning、DQN、策略梯度及Actor-Critic等算法框架。重点探讨了现代RL算法PPO的原理及其在大模型RLHF(基于人类反馈的强化学习)中的关键作用,如ChatGPT的优化过程。同时指出RL面临的挑战(奖励设计、样本效率等)及未来发展方向(分层RL、世界模型等)

文章图片
#深度学习#人工智能#语言模型
深度学习进阶(六)——世界模型与具身智能:AI的下一次跃迁

AI研究正从语言智能转向具身智能和世界模型,这是通向通用人工智能的关键路径。当前大语言模型虽能处理文本,但缺乏对物理世界的真实理解。世界模型通过编码器、动力学模型和解码器的闭环,让AI具备"内在模拟"能力,实现预测和规划。DeepMind的Dreamer系列和MuZero等突破表明,AI已能在"梦境"中学习策略。具身智能强调感知-行动闭环,使AI通过身体交互

文章图片
#人工智能#深度学习
深度学习入门(五)——常见模块与工程实践:从激活函数到BatchNorm、Dropout、初始化与训练稳定性

本文深入探讨了深度学习训练中的关键模块与实践经验。主要内容包括:1)激活函数的选择与比较(如ReLU、GELU等);2)BatchNormalization的原理与优势;3)Dropout的正则化作用;4)权重初始化策略(Xavier、He等);5)正则化技巧与学习率调度方法。文章强调,良好的训练稳定性需要这些模块的协同配合,并提供了工程实践建议:如卷积网络推荐ReLU+BN组合,Transfor

文章图片
#深度学习#人工智能
深度学习进阶(八)——AI 操作系统的雏形:AgentOS、Devin 与多智能体协作

AI正从单一模型向系统化协作演进。早期大模型追求规模与精度,但存在记忆、调度等局限,催生了AutoGPT等智能体框架。多智能体协作(如ChatDev)通过角色分工实现任务并发,采用结构化通信协议提升效率。Devin首创AI工程师系统,集成开发环境与记忆管理,形成感知-行动-反馈循环。AgentOS雏形显现,包含智能体调度、记忆存储等模块,类似操作系统管理语义进程。当前框架如LangChain侧重工

文章图片
#人工智能#深度学习
    共 31 条
  • 1
  • 2
  • 3
  • 4
  • 请选择