罗西的思考个人主页

@weixin_47364682

罗西的思考

2023-09-25 10:45:27 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AI Agent框架探秘：拆解 OpenHands（10）--- Runtime

Agent = 模型 + 工具 + 编排层 + 部署运行时，这里和目前大部分的 AI Agent 的定义（LLM + Tool + Memory）多了一层部署运行时。因此可见Runtime的重要性。在 OpenHands 里，真正让“AI 想法”落地就是Runtime。它像一座可移动的实验室：四面墙把主机世界隔开，却给 Agent 留下齐全的操作台（文件、终端、网络）。

#人工智能

AI Agent框架探秘：拆解 OpenHands（9）--- AgentController

控制器唯一标识IDid: str# 被控制的Agent实例（核心决策组件）# Agent执行的最大迭代次数（防止无限循环）# 事件流实例（组件间通信的核心枢纽）# 当前系统状态（包含完整上下文信息）# 动作确认模式开关（开启时需确认后才执行Agent动作）# Agent名称到LLM配置的映射（用于委托代理场景）# Agent名称到Agent配置的映射（用于委托代理场景）# 父控制器实例（存在层级委

#人工智能 #机器学习

[源码解析] 深度学习流水线并行 PipeDream(4)--- 运行时引擎

[源码解析] 深度学习流水线并行 PipeDream(4)— 运行时引擎文章目录[源码解析] 深度学习流水线并行 PipeDream(4)--- 运行时引擎0x00 摘要0x01 前言1.1 前文回顾1.2 运行时系统1.2.1 PyTorch 的特点1.2.2 PyTorch RPCDistributed RPC framework APIs [Now Stable]1.2.3 PipeDrea

#深度学习

AI Agent框架探秘：拆解 OpenHands（8）--- CodeActAgent

大模型是不可控的。不是‘给LLM一堆工具让它自由发挥’，而是大部分由确定性代码构成，在关键决策点巧妙地融入LLM能力。好的 Agent 应用，是工程设计与 AI 能力的精妙结合，而不是对 AI 的盲目放权。在 OpenHands 智能框架的生态中，CodeActAgent 占据着核心地位，它是基于 CodeAct 理念构建的核心代理模块。其设计初衷极具巧思：将各类复杂任务统一转化为 “代码执行”

#人工智能

[源码解析] 深度学习流水线并行 PipeDream(6)--- 1F1B策略

在前文中，我们介绍了PipeDream的总体架构，Profile阶段，计算分区阶段，模型转换阶段，运行时引擎和通信模块，本文是 PipeDream 系列最后一篇，介绍 1F1B 策略，这是 PipeDream 最大的贡献。

#深度学习 #pytorch

[源码解析] 深度学习流水线并行Gpipe(1)---流水线基本实现

GPipe是一个基于 Lingvo （Lingvo 是 Google 基于 TensorFlow 二次开发的重点针对序列模型的框架）开发的，支持超大规模模型的神经网络训练并行库，本文介绍其基本功能和流水线机制。

#深度学习 #机器学习

[源码解析] 机器学习参数服务器 Paracel (1)-----总体架构

Paracel是豆瓣开发的一个分布式计算框架，它基于参数服务器范式来解决机器学习的问题，本文主要分析其架构，并且与ps-lite做分析比对。

#机器学习

Alink漫谈(二) : 从源码看机器学习平台Alink设计和架构

Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台，是业界首个同时支持批式算法、流式算法的机器学习平台。本文是漫谈系列的第二篇，将从源码入手，带领大家具体剖析Alink设计思想和架构为何。

[源码解析] 机器学习参数服务器ps-lite (1) ----- PostOffice

参数服务器是机器学习训练一种范式，是为了解决分布式机器学习问题的一个编程框架。本文是参数服务器系列第一篇，介绍ps-lite的总体设计和基础模块 Postoffice。

#机器学习

[源码分析] Facebook如何训练超大模型--- (5)

之前文章之中我们谈到了FSDP支持混合精度训练，本篇来看看 Activation recomputation。

#facebook #深度学习 #计算机视觉

共 76 条

请选择