logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

那些刷榜第一的 AI Agent,为什么到了真实场景就不行了?

这篇CSDN博客揭露了当前AI Agent基准测试中存在的严重作弊问题。UC Berkeley研究发现,主流AI测试如SWE-bench等存在系统性漏洞,Agent可以通过修改测试环境、伪造结果等方式轻松获得高分。文章指出,这些作弊手法已在实际应用中悄然出现,导致基准分数严重失真。作者结合工业视觉检测经验,提出验证AI编程工具的五步法:使用真实项目、检查修改范围、长对话测试、跨文件重构验证和实际效

文章图片
#人工智能#目标检测#opencv
别让你的OpenClaw失忆:我用三层记忆架构解决了上下文断裂问题

你有没有这种感觉:昨天和 AI 聊了一个技术方案,交代了背景、讨论了方向、达成了一个关键结论。今天再开一个新对话——“我们上次说到哪来着?AI Agent 每次对话都是从零开始。上下文窗口关闭的那一刻,所有结论都消失了。一个月后,你已经忘了当时想到了什么,AI 更不可能记得。这就是上下文断裂问题——AI Agent 最大的硬伤。我用了三个月,搭了一套三层记忆架构解决这个问题。不只是"让 AI 记住

文章图片
#python
Karpathy LLM Wiki 实战落地:用 OpenClaw 多 Agent 做了三个关键升级

做技术的人,知识焦虑是常态。论文要看、方案要写、算法要调、客户要跟、政策要学。每件事都重要,但串起来就是一团乱麻。文件夹分类——建了一套"客户/技术/政策/产品"的目录,每次新笔记都面临灵魂拷问:这算技术还是产品?最后堆在"杂项"里吃灰。RAG——向量数据库 + Embedding API + LangChain,花了两周搭好,每次回答都是碎片拼凑,没有上下文,没有逻辑关联。更致命的是:RAG不积

文章图片
#python
我用 OpenClaw 搭了一套多Agent对抗式开发流水线,一个需求2.5小时出可运行代码

作为工业视觉领域的工程师,白天跑客户、谈方案、做报价,晚上还要写算法、调模型、搭系统。一个完整产品从需求到可运行代码,传统方式少说一周。但一周对于冷启动阶段的一人公司来说,太奢侈了。上下文焦虑(任务一长就急着收工)和自我评价膨胀(写完永远说"完美通过")。解法来自两个地方:Anthropic的一篇工程博客,和我从GAN(生成对抗网络)借来的一个思路。

文章图片
#人工智能
别让你的OpenClaw失忆:我用三层记忆架构解决了上下文断裂问题

你有没有这种感觉:昨天和 AI 聊了一个技术方案,交代了背景、讨论了方向、达成了一个关键结论。今天再开一个新对话——“我们上次说到哪来着?AI Agent 每次对话都是从零开始。上下文窗口关闭的那一刻,所有结论都消失了。一个月后,你已经忘了当时想到了什么,AI 更不可能记得。这就是上下文断裂问题——AI Agent 最大的硬伤。我用了三个月,搭了一套三层记忆架构解决这个问题。不只是"让 AI 记住

文章图片
#python
Karpathy LLM Wiki 实战落地:用 OpenClaw 多 Agent 做了三个关键升级

做技术的人,知识焦虑是常态。论文要看、方案要写、算法要调、客户要跟、政策要学。每件事都重要,但串起来就是一团乱麻。文件夹分类——建了一套"客户/技术/政策/产品"的目录,每次新笔记都面临灵魂拷问:这算技术还是产品?最后堆在"杂项"里吃灰。RAG——向量数据库 + Embedding API + LangChain,花了两周搭好,每次回答都是碎片拼凑,没有上下文,没有逻辑关联。更致命的是:RAG不积

文章图片
#python
我用 OpenClaw 搭了一套多Agent对抗式开发流水线,一个需求2.5小时出可运行代码

作为工业视觉领域的工程师,白天跑客户、谈方案、做报价,晚上还要写算法、调模型、搭系统。一个完整产品从需求到可运行代码,传统方式少说一周。但一周对于冷启动阶段的一人公司来说,太奢侈了。上下文焦虑(任务一长就急着收工)和自我评价膨胀(写完永远说"完美通过")。解法来自两个地方:Anthropic的一篇工程博客,和我从GAN(生成对抗网络)借来的一个思路。

文章图片
#人工智能
工业视觉踩坑实录(六):SOP行为检测:用AI替你盯着工厂流水线

文章摘要 SOP行为检测:AI赋能工厂流水线监管 工业场景中,标准作业程序(SOP)的执行依赖人工监督,存在监管成本高、覆盖率低等问题。本文介绍了一种基于AI视觉的SOP行为检测系统,通过摄像头实时监控工人操作流程,自动识别违规行为(如跳步、乱序、穿戴不规范等)。 系统采用分层架构:人体检测→姿态估计→状态机判定→告警展示,相比端到端方案更具可解释性和适应性。关键技术包括ROI区域过滤、简单跟踪算

文章图片
#人工智能#目标检测#opencv
工业视觉踩坑实录(五):系统上线第二天就崩了,我才意识到边缘部署有多难

摘要: 本文分享了工业视觉算法在边缘设备部署中的实战经验。作者从10年行业经验出发,指出边缘部署的稳定性挑战比算法开发更关键,并总结了常见问题:算力不足、内存泄漏和网络不稳定。文中详细介绍了设备选型(推荐Jetson Orin系列)、模型加速(量化、尺寸优化)、自适应抽帧策略和内存管理技巧,强调留足算力余量、动态调整检测频率和实现稳健的重连机制。这些来自真实项目的优化方案能显著提升边缘部署的可靠性

文章图片
#目标检测#opencv#人工智能
到底了