logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【SkillRL】自动学习技能 训练方法

阶段教师模型作用是否使用蒸馏轨迹构造生成完整任务轨迹(action + reasoning)否,直接生成技能提取分析轨迹,提取行为模式否,直接提取动态更新分析失败案例,生成新技能否,直接生成SFT训练不涉及否,监督学习RL训练仅在动态更新时调用部分(技能来自教师,策略来自RL)关键理解教师模型不参与模型训练的参数更新教师模型只用于生成训练数据(轨迹、技能)模型能力提升来自:SFT阶段:学习轨迹中的

#人工智能
【SkillRL】论文解读

SKILLRL 是一个端到端的智能体训练框架,核心目标是将原始交互经验转化为可复用的结构化技能,并让技能库与智能体策略在强化学习过程中递归共同进化。经验蒸馏阶段:用基础模型在环境中采样轨迹,通过教师模型将成功和失败轨迹分别蒸馏为可执行的技能技能库构建阶段:将蒸馏得到的技能组织成分层结构的 SKILLBANK,支持高效的自适应检索递归进化RL阶段:先通过冷启动SFT让模型学会使用技能,再用GRPO优

#人工智能
【2026目标检测】高质量模型汇总

在目标检测领域,模型的速度与效果往往难以两全,有一批模型虽运行速度较慢,但凭借出色的检测效果占据一席之地,同时还有各类实用型算法和框架可供选择,今天就来全面梳理这些值得关注的工具与模型。

#目标检测#目标跟踪#人工智能
【MinerU】 Docker Compose 使用

(如不能同时运行 api + openai-server)。如果需要多种服务,只能运行其中一个,或使用 Router 聚合远程 API。目前 compose.yaml 不直接支持昇腾 NPU 的设备透传配置,建议使用。Docker Compose 需要 MinerU 的 Docker 镜像,需先构建。:Docker 部署仅支持 Linux 和 Windows WSL2,使用 NPU Dockerf

#docker#容器
【MinerU】 Docker Compose 使用

(如不能同时运行 api + openai-server)。如果需要多种服务,只能运行其中一个,或使用 Router 聚合远程 API。目前 compose.yaml 不直接支持昇腾 NPU 的设备透传配置,建议使用。Docker Compose 需要 MinerU 的 Docker 镜像,需先构建。:Docker 部署仅支持 Linux 和 Windows WSL2,使用 NPU Dockerf

#docker#容器
【MinerU】 Docker Compose 使用

(如不能同时运行 api + openai-server)。如果需要多种服务,只能运行其中一个,或使用 Router 聚合远程 API。目前 compose.yaml 不直接支持昇腾 NPU 的设备透传配置,建议使用。Docker Compose 需要 MinerU 的 Docker 镜像,需先构建。:Docker 部署仅支持 Linux 和 Windows WSL2,使用 NPU Dockerf

#docker#容器
【MinerU】昇腾910B部署

宿主机安装Ascend NPU 驱动(Driver 23.0.3+)构建镜像(基础镜像已包含 CANN + torch_npu + vllm)启动容器时挂载驱动目录和透传 NPU 设备容器内运行MinerU 命令。

【MinerU】昇腾910B部署

宿主机安装Ascend NPU 驱动(Driver 23.0.3+)构建镜像(基础镜像已包含 CANN + torch_npu + vllm)启动容器时挂载驱动目录和透传 NPU 设备容器内运行MinerU 命令。

【MinerU】多类型文件解析与模型管理

【MinerU】多类型文件解析与模型管理

    共 142 条
  • 1
  • 2
  • 3
  • 15
  • 请选择