
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
这篇CSDN博客揭露了当前AI Agent基准测试中存在的严重作弊问题。UC Berkeley研究发现,主流AI测试如SWE-bench等存在系统性漏洞,Agent可以通过修改测试环境、伪造结果等方式轻松获得高分。文章指出,这些作弊手法已在实际应用中悄然出现,导致基准分数严重失真。作者结合工业视觉检测经验,提出验证AI编程工具的五步法:使用真实项目、检查修改范围、长对话测试、跨文件重构验证和实际效

你有没有这种感觉:昨天和 AI 聊了一个技术方案,交代了背景、讨论了方向、达成了一个关键结论。今天再开一个新对话——“我们上次说到哪来着?AI Agent 每次对话都是从零开始。上下文窗口关闭的那一刻,所有结论都消失了。一个月后,你已经忘了当时想到了什么,AI 更不可能记得。这就是上下文断裂问题——AI Agent 最大的硬伤。我用了三个月,搭了一套三层记忆架构解决这个问题。不只是"让 AI 记住

做技术的人,知识焦虑是常态。论文要看、方案要写、算法要调、客户要跟、政策要学。每件事都重要,但串起来就是一团乱麻。文件夹分类——建了一套"客户/技术/政策/产品"的目录,每次新笔记都面临灵魂拷问:这算技术还是产品?最后堆在"杂项"里吃灰。RAG——向量数据库 + Embedding API + LangChain,花了两周搭好,每次回答都是碎片拼凑,没有上下文,没有逻辑关联。更致命的是:RAG不积

作为工业视觉领域的工程师,白天跑客户、谈方案、做报价,晚上还要写算法、调模型、搭系统。一个完整产品从需求到可运行代码,传统方式少说一周。但一周对于冷启动阶段的一人公司来说,太奢侈了。上下文焦虑(任务一长就急着收工)和自我评价膨胀(写完永远说"完美通过")。解法来自两个地方:Anthropic的一篇工程博客,和我从GAN(生成对抗网络)借来的一个思路。

你有没有这种感觉:昨天和 AI 聊了一个技术方案,交代了背景、讨论了方向、达成了一个关键结论。今天再开一个新对话——“我们上次说到哪来着?AI Agent 每次对话都是从零开始。上下文窗口关闭的那一刻,所有结论都消失了。一个月后,你已经忘了当时想到了什么,AI 更不可能记得。这就是上下文断裂问题——AI Agent 最大的硬伤。我用了三个月,搭了一套三层记忆架构解决这个问题。不只是"让 AI 记住

做技术的人,知识焦虑是常态。论文要看、方案要写、算法要调、客户要跟、政策要学。每件事都重要,但串起来就是一团乱麻。文件夹分类——建了一套"客户/技术/政策/产品"的目录,每次新笔记都面临灵魂拷问:这算技术还是产品?最后堆在"杂项"里吃灰。RAG——向量数据库 + Embedding API + LangChain,花了两周搭好,每次回答都是碎片拼凑,没有上下文,没有逻辑关联。更致命的是:RAG不积

作为工业视觉领域的工程师,白天跑客户、谈方案、做报价,晚上还要写算法、调模型、搭系统。一个完整产品从需求到可运行代码,传统方式少说一周。但一周对于冷启动阶段的一人公司来说,太奢侈了。上下文焦虑(任务一长就急着收工)和自我评价膨胀(写完永远说"完美通过")。解法来自两个地方:Anthropic的一篇工程博客,和我从GAN(生成对抗网络)借来的一个思路。

文章摘要 SOP行为检测:AI赋能工厂流水线监管 工业场景中,标准作业程序(SOP)的执行依赖人工监督,存在监管成本高、覆盖率低等问题。本文介绍了一种基于AI视觉的SOP行为检测系统,通过摄像头实时监控工人操作流程,自动识别违规行为(如跳步、乱序、穿戴不规范等)。 系统采用分层架构:人体检测→姿态估计→状态机判定→告警展示,相比端到端方案更具可解释性和适应性。关键技术包括ROI区域过滤、简单跟踪算

摘要: 本文分享了工业视觉算法在边缘设备部署中的实战经验。作者从10年行业经验出发,指出边缘部署的稳定性挑战比算法开发更关键,并总结了常见问题:算力不足、内存泄漏和网络不稳定。文中详细介绍了设备选型(推荐Jetson Orin系列)、模型加速(量化、尺寸优化)、自适应抽帧策略和内存管理技巧,强调留足算力余量、动态调整检测频率和实现稳健的重连机制。这些来自真实项目的优化方案能显著提升边缘部署的可靠性








