Terrence.虚个人主页

@weixin_42001184

Terrence.虚

2022-12-06 20:43:23 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Agent 开发工程化深度解析：从 Tool Calling 到 Harness、Memory、Hooks 与结构化 Observation

AI Agent工程化开发的核心挑战与实践本文深入探讨了AI Agent在企业级应用开发中的关键问题，指出当前简单的"LLM+工具调用"模式远远不能满足复杂业务需求。文章系统性地分析了Agent工程化的核心挑战，包括参数缺失处理、工具失败恢复、结果冲突仲裁、权限控制、记忆管理等实际问题，并提出了Harness Engineering框架作为解决方案。该框架包含上下文构造、工具注册、权限管理、记忆

#服务器 #人工智能 #RAG

大模型部署工具对比

本文对比了vLLM、SGLang和Ollama三款AI推理工具的核心定位与技术差异。vLLM是面向生产的高性能推理引擎，专注于吞吐优化和KV Cache管理；SGLang擅长处理结构化生成任务，通过RadixAttention复用前缀缓存；Ollama则是本地模型运行器，适合个人体验而非生产部署。三者定位不同：vLLM适合企业级服务，SGLang优化复杂任务处理，Ollama侧重本地低门槛使用。选

#人工智能 #计算机视觉 #深度学习

关于传统软件工程后端技术和当代AI智能体agent构建的harness engineering的一点思考

本文探讨了如何将传统后端开发的工程化原则应用于Agent开发，以实现生产级Agent的鲁棒性和可靠性。核心观点包括：异常处理体系：借鉴后端分层捕获、分类处理、容错兜底等原则，构建Agent的异常处理框架，包括自定义异常分类、重试机制、熔断降级等策略。测试方法论：移植后端测试金字塔到Agent开发，强调单元测试、集成测试、异常测试（混沌测试）和性能测试的重要性，特别指出"测试异常比测试正常更重要

#软件工程 #人工智能

多模态视觉大模型的架构

参考文献： Awais M, Naseer M, Khan S, et al. Foundational models defining a new era in vision: A survey and outlook. arXiv, 2023.参考文献： Alayrac J B, Donahue J, Luc P, et al. Flamingo: a visual language mode

#深度学习 #人工智能 #nlp +1

工业级多模态人机协作系统项目小总结

该方案成功解决了工业场景中复杂环境下多模态交互的三大核心难题：跨模态理解的准确性、系统响应的实时性、设备控制的精准性。其技术方法论可迁移至其他智能工厂、协作机器人等领域。

#人工智能 #深度学习 #nlp +1

RAG技术学习记录（一）

RAG（检索增强生成）技术结合检索系统与大语言模型，通过外部知识库弥补模型的知识局限与幻觉问题。其流程包括知识文档准备、Embedding向量化、向量数据库构建、查询检索和生成回答。RAG发展经历了从Naive RAG到Advanced RAG、Modular RAG再到Agentic RAG的演进：Naive RAG采用静态单次检索生成；Advanced RAG通过查询改写、混合检索和重排序等技

#人工智能 #RAG #python +1

从YOLO，RCNN到DETR和deformable-DETR

本文探讨目标检测中anchor的必要性，指出anchor并非必须但几何先验、样本分配等核心问题仍需解决。从R-CNN的候选区域到Faster R-CNN引入anchor机制，再到YOLOv1的直接回归和后续改进，展示了检测模型的演进逻辑：anchor是一种工程折中方案，而非本质需求。不同方法通过外部proposal、anchor模板或点预测等方式处理检测任务的结构性难题，但都需解决候选生成、多尺度

SLAM算法评测工具——开源工具EVO（以VINS为例）

EVO开源库的下载安装和基本使用入门的相关介绍。

#算法 #python

多模态视觉大模型的架构

#深度学习 #人工智能 #nlp +1

darknet-19与darknet53

Darknet是最经典的一个深层网络，结合Resnet的特点在保证对特征进行超强表达的同时又避免了网络过深带来的梯度问题，主要有Darknet19和Darknet53。

#深度学习 #神经网络 #计算机视觉

共 15 条

请选择