安如衫个人主页

@Raymond_Duu

安如衫

2023-03-31 23:22:15 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从 OCR 到多模态 VLM Agentic AI：智能文档问答的范式转移全解

阶段二标志着我们从“数据数字化”迈向了“数据智能化”。通过 PaddleOCR 布局检测，我们把文档切分成了语义块；通过 LayoutLM，我们重建了人类的阅读逻辑；通过 VLM 工具链，我们让 Agent 拥有了“看懂”图表的能力。

#人工智能 #RAG

Claude Code 核心团队血泪复盘：后悔使用/构建 Agent 时没早点刷到

AI工程师构建Agent的常见误区与优化策略摘要：AI工程师在构建智能Agent时容易陷入过度设计、工具滥用等误区，导致Agent性能下降。本文总结了三个关键优化原则：1）采用渐进式信息披露，让Agent自主探索而非被动接受信息；2）工具设计应顺应模型直觉，通过实验迭代保持时效性；3）面向缓存命中率优化系统设计，避免破坏对话上下文。文章还介绍了Skills机制作为Agent的行为规范，通过预设工

Claude Code 核心团队血泪复盘：后悔使用/构建 Agent 时没早点刷到

【Hello-ROCm】vLLM 跑通 Gemma4-E4B

Datawhale × AMD AI 学习中心 Day1-2 实操任务。

LLM基础（五）：微调与强化学习——后训练

本文介绍LLM“后训练”技术，用于实现模型对齐。核心包括：1) 依赖标准答案的“监督微调”(SFT)；2) 依赖奖励函数的“强化微调”(RFT)。文章强调了成功的关键是“评估驱动”的迭代闭环（评估-分析-靶向-微调），并证明数据质量远胜于数量。最后简要介绍了生产环境中的监控、告警与干预。

#人工智能 #DeepSeek

Agent Harness 概念详解

摘要： Agent Harness 是为解决大模型在长线任务中的上下文限制问题而设计的外骨骼系统。随着模型上下文窗口扩展至1M，仍面临失焦和记忆衰退问题。文章提出从"提示词工程"转向"上下文工程"，通过压缩技术、结构化笔记和子代理架构优化token效用。Agent Harness包含初始化Agent和执行Agent，前者搭建任务基础环境，后者采用增量式Ral

#人工智能 #大数据 #前端

Claude Code 核心团队血泪复盘：后悔使用/构建 Agent 时没早点刷到

Skills 元年，一人公司的时代要来了：速通 Anthropic 通识课

然而，每一位开发者可能都经历过这样的痛苦：为不同的项目重复编写相似的提示词（Prompt），在有限的 Context Window（上下文窗口）中艰难地平衡工具定义与业务规则，或者看着自己精心调试的 Agent 无法迁移到新的运行环境。知识就是产品：Skills Marketplace 的出现是必然，Skill 不受模型迭代和运行环境的干扰，它是可交易的标准化的商品/产品，由标配 Skills 的

#AI

从 OCR 到多模态 VLM Agentic AI：智能文档问答的范式转移全解

#人工智能 #RAG

Skills 元年，一人公司的时代要来了：速通 Anthropic 通识课

#AI

共 12 条

请选择