logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从 OCR 到多模态 VLM Agentic AI:智能文档问答的范式转移全解

阶段二标志着我们从“数据数字化”迈向了“数据智能化”。通过 PaddleOCR 布局检测,我们把文档切分成了语义块;通过 LayoutLM,我们重建了人类的阅读逻辑;通过 VLM 工具链,我们让 Agent 拥有了“看懂”图表的能力。

#人工智能#RAG
Skills 元年,一人公司的时代要来了:速通 Anthropic 通识课

然而,每一位开发者可能都经历过这样的痛苦:为不同的项目重复编写相似的提示词(Prompt),在有限的 Context Window(上下文窗口)中艰难地平衡工具定义与业务规则,或者看着自己精心调试的 Agent 无法迁移到新的运行环境。知识就是产品:Skills Marketplace 的出现是必然,Skill 不受模型迭代和运行环境的干扰,它是可交易的标准化的商品/产品,由标配 Skills 的

文章图片
#AI
LLM基础(五):微调与强化学习——后训练

本文介绍LLM“后训练”技术,用于实现模型对齐。核心包括:1) 依赖标准答案的“监督微调”(SFT);2) 依赖奖励函数的“强化微调”(RFT)。文章强调了成功的关键是“评估驱动”的迭代闭环(评估-分析-靶向-微调),并证明数据质量远胜于数量。最后简要介绍了生产环境中的监控、告警与干预。

文章图片
#人工智能#DeepSeek
Mac一直加载硬盘加载不出来

磁盘修复检查进程fsck导致硬盘不显示。

文章图片
#bug#macos
到底了