logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI Agent框架探秘:拆解 OpenHands(10)--- Runtime

Agent = 模型 + 工具 + 编排层 + 部署运行时,这里和目前大部分的 AI Agent 的定义(LLM + Tool + Memory)多了一层部署运行时。因此可见Runtime的重要性。在 OpenHands 里,真正让“AI 想法”落地就是Runtime。它像一座可移动的实验室:四面墙把主机世界隔开,却给 Agent 留下齐全的操作台(文件、终端、网络)。

#人工智能
AI Agent框架探秘:拆解 OpenHands(9)--- AgentController

控制器唯一标识IDid: str# 被控制的Agent实例(核心决策组件)# Agent执行的最大迭代次数(防止无限循环)# 事件流实例(组件间通信的核心枢纽)# 当前系统状态(包含完整上下文信息)# 动作确认模式开关(开启时需确认后才执行Agent动作)# Agent名称到LLM配置的映射(用于委托代理场景)# Agent名称到Agent配置的映射(用于委托代理场景)# 父控制器实例(存在层级委

#人工智能#机器学习
[源码解析] 深度学习流水线并行 PipeDream(4)--- 运行时引擎

[源码解析] 深度学习流水线并行 PipeDream(4)— 运行时引擎文章目录[源码解析] 深度学习流水线并行 PipeDream(4)--- 运行时引擎0x00 摘要0x01 前言1.1 前文回顾1.2 运行时系统1.2.1 PyTorch 的特点1.2.2 PyTorch RPCDistributed RPC framework APIs [Now Stable]1.2.3 PipeDrea

#深度学习
AI Agent框架探秘:拆解 OpenHands(8)--- CodeActAgent

大模型是不可控的。不是‘给LLM一堆工具让它自由发挥’,而是大部分由确定性代码构成,在关键决策点巧妙地融入LLM能力。好的 Agent 应用,是工程设计与 AI 能力的精妙结合,而不是对 AI 的盲目放权。在 OpenHands 智能框架的生态中,CodeActAgent 占据着核心地位,它是基于 CodeAct 理念构建的核心代理模块。其设计初衷极具巧思:将各类复杂任务统一转化为 “代码执行”

#人工智能
[源码解析] 深度学习流水线并行 PipeDream(6)--- 1F1B策略

在前文中,我们介绍了PipeDream的总体架构,Profile阶段,计算分区阶段,模型转换阶段,运行时引擎和通信模块,本文是 PipeDream 系列最后一篇,介绍 1F1B 策略,这是 PipeDream 最大的贡献。

#深度学习#pytorch
[源码解析] 深度学习流水线并行Gpipe(1)---流水线基本实现

GPipe是一个基于 Lingvo (Lingvo 是 Google 基于 TensorFlow 二次开发的重点针对序列模型的框架)开发的,支持超大规模模型的神经网络训练并行库,本文介绍其基本功能和流水线机制。

#深度学习#机器学习
[源码解析] 机器学习参数服务器 Paracel (1)-----总体架构

Paracel是豆瓣开发的一个分布式计算框架,它基于参数服务器范式来解决机器学习的问题,本文主要分析其架构,并且与ps-lite做分析比对。

#机器学习
Alink漫谈(二) : 从源码看机器学习平台Alink设计和架构

Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文是漫谈系列的第二篇,将从源码入手,带领大家具体剖析Alink设计思想和架构为何。

[源码解析] 机器学习参数服务器ps-lite (1) ----- PostOffice

参数服务器是机器学习训练一种范式,是为了解决分布式机器学习问题的一个编程框架。本文是参数服务器系列第一篇,介绍ps-lite的总体设计和基础模块 Postoffice。

#机器学习
[源码分析] Facebook如何训练超大模型--- (5)

之前文章之中我们谈到了FSDP支持混合精度训练,本篇来看看 Activation recomputation。

#facebook#深度学习#计算机视觉
    共 76 条
  • 1
  • 2
  • 3
  • 8
  • 请选择