
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
豆包手机与AutoGLM代表了两种不同的AI手机技术路线:前者通过系统级深度集成,直接读取GPU渲染缓存并注入输入事件,拥有超高权限但面临平台封杀;后者采用外部ADB控制方案,依赖标准调试接口,虽权限受限但更开放合规。两者的核心差异在于部署位置(系统内生vs云端控制)、权限边界(私有特权vs公共接口)以及对移动互联网商业模式的冲击程度。豆包手机的高效自动化直接挑战了以注意力经济为基础的现有生态,而

Verl框架通过优化强化学习流程实现高效训练,在单卡A800上1.5B模型GSM8K准确率从49%提升至80%。其核心创新包括:采用vLLM加速推理(提速4-6倍)、GRPO算法省去Critic模型(节省30-40%显存)、三模型协作架构。教程涵盖从环境配置到评估部署全流程,重点解决推理慢、显存紧张、调度复杂等痛点。关键注意事项包括:保持训练/验证prompt一致性、合理设置批次参数、准确提取数学

在数据驱动的时代,文档早已不只是文字。本文将带你从零搭建一个 DeepSeek-OCR 驱动的多模态数据分析 Agent,实现从 PDF → 结构化数据 → 可视化大屏 的一键自动化流程。我们将结合 DeepSeek-OCR + vLLM 推理加速 + LangChain 1.0 工作流编排,彻底打通 “图像识别 → 文本解析 → 指标抽取 → 交互式报告生成” 的全链路,助你高效解析财报、科研论

本篇文章系统梳理了企业级常用的三类多模态 OCR 工具 —— MinerU、PaddleOCR-VL、DeepSeek-OCR,并从场景适配角度分析了它们各自的技术侧重点与应用价值。文章以实战为导向,展示如何将三大 OCR 解析引擎通过 vLLM 推理框架部署为独立服务,并进一步构建一个可统一调用的多模态解析系统

LangChain 1.1实现Claude Skills的动态工具过滤功能,解决传统AI Agent在处理大量工具时面临的上下文窗口耗尽和模型"选择困难"问题。通过分析Claude Skills的核心思想——运行时按需加载工具,文章详细展示了如何利用LangChain 1.1新增的Middleware API实现动态工具过滤、状态管理和请求修改。相比早期版本需要复杂hack的实

这个项目用最前沿的DPO技术,解决了最实际的业务痛点。通过7分钟的训练,就让通用AI变身专业的儿童服装顾问,这就是大模型微调的魅力!
本文介绍了使用强化学习中的DPO算法来提升AI Agent工具调用能力的实战方法。主要内容包括:1)记录Agent调用过程获取原始数据;2)通过AutoToolDPO自动生成DPO微调数据集,解决人工标注成本高的问题;3)使用LLaMA Factory进行模型微调。项目提供完整代码,可高效生成符合DPO格式的训练数据,显著提升Agent在工具选择、参数拼接和多轮对话中的准确性。

本文介绍了基于Agent-Lightning框架的SQL-Agent强化学习实战方法。项目采用运行与训练分离的架构设计,通过LangGraph实现SQL Agent的运行逻辑,记录自然语言到SQL转换的完整轨迹。训练模块利用veRL框架和GRPO算法,根据执行结果自动优化模型策略,形成"执行-反馈-优化"的闭环训练流程。实验在H800显卡上进行,通过Agent-Lightnin

NL2SQL的概念与价值,覆盖数据自助分析、智能报表与运营分析等典型应用场景。对比多款热门开源产品(Vanna、DB-GPT、PandasAI等),总结各自定位、优势与局限。提供基于LangChain 1.0的完整NL2SQL数据分析Agent实现方案,包含前后端架构、CSV→SQLite转换与API接口设计。面向企业级数据应用,强调Agent化查询、流式响应与自动可视化的落地能力。

LangChain 1.0 Agent开发摘要 LangChain 1.0引入了革命性的create_agent()API,将Agent从简单的模型调用器升级为具备决策与执行能力的智能运行体。新版本通过统一API接口简化了开发流程,取代了0.x时代的碎片化设计。核心优势包括: LangGraph驱动:底层采用LangGraph作为执行引擎,使Agent具备生命周期管理和节点化执行能力 三大核心组件








