logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

推理服务为什么一上模型压缩组合就开始精度雪崩:从量化-剪枝-蒸馏的叠加效应到恢复策略的工程实战

在生产环境中,团队常同时对大模型做量化、剪枝与蒸馏以降低成本,却发现组合压缩后的精度断崖式下降。本文通过 LLaMA-2-7B 的实验验证,揭示量化误差、结构损伤与蒸馏近似的叠加放大机制,并提出渐进式压缩恢复策略,帮助推理服务在降本与精度之间找到工程平衡点。

文章图片
#人工智能#深度学习
Agent 一接 MCP 大结果集就开始失忆:从 Result Summarization 到 Cursor Paging 的工程实战

这篇文章聚焦 Agent 接入 MCP 后常见的“大结果集失忆”问题:工具返回成百上千条记录,模型前几轮还能对齐上下文,几轮检索后就开始漏字段、串对象、重复翻页,最后把真正关键的数据淹没在噪声里。文章从结果摘要、游标分页、字段裁剪和二次确认四个工程抓手切入,给出一套能直接落地的稳定化方案,适合做 MCP、RAG 工具层和企业内部数据代理的人参考。

文章图片
#人工智能#深度学习#MCP
「聊天已死」:ChatGPT 变身 AgentGPT,AI 助手进入执行时代

聊天已死」并不意味着 ChatGPT 消失,而是它将以一种更强大、更主动的形态重生 🌟。对于技术从业者而言,这既是挑战也是机遇——AI 不再只是一个「会说话的百科」,而是一个「能动手的助理」。在这场从「说」到「做」的范式转移中,谁能更快地拥抱 Agent 化的 AI 工具链,谁就能在下一轮技术浪潮中领先一步 💪。[图片]本文基于 OpenAI 官方信息、金融时报报道及行业分析综合撰写。

#人工智能#ChatGPT#AI智能体
【无标题】

2026年6月16日,阿里巴巴发布千问具身智能大模型Qwen-Robot系列,包含操作/移动/世界三大模型,为机器人提供通用底座。本文深度解读三位一体架构设计、行业意义及具身智能未来展望。

#机器人
苹果终于掏出 AI 王牌,Claude 和 ChatGPT 正面开打——本周 AI 圈四大看点

苹果 WWDC 发布 Apple Intelligence 重构 Siri,Anthropic 推出 Claude Fable 5 并启动 IPO,智源发布世界模型悟界 Physis,OpenAI 联手 Visa 开启 AI 代理支付新时代。

文章图片
#人工智能#AI
Agent 一接消息通知中心就开始误点跳转:从 Notification Claim 到 Target Proof 的工程实战

这篇文章聚焦 Agent 接入消息通知中心后常见的“跳错目标”问题:同一屏里同时存在评论、审批、系统告警和提及提醒,模型表面上看懂了列表,真正点击时却把未读消息、来源对象和目标页面串在一起,最后落到错误线程、错误工单或错误详情页。文章从 Notification Claim、目标校验、跳转前证明和回退策略四个抓手切入,给出一套可落地的稳定化方案,适合做办公自动化、客服后台和企业协同 Agent 的

文章图片
#python#java#javascript +2
Agent 一接邮箱线程就开始错发回复:从 Thread Claim 到 Draft Commit 的工程实战

邮件 Agent 最危险的不是不会写回复,而是把上一封线程、错误收件人和过期草稿一起提交。本文围绕 Thread Claim 与 Draft Commit 两个关键机制,拆解邮箱自动化为什么总在最后一步翻车:只靠主题匹配会串线程,只靠正文理解会漏收件人变化,只靠缓存草稿会把旧上下文重新发出。文章给出一套可落地的线程认领、收件人哈希校验与发送前重放方案,帮助团队把误回复、错抄送和旧草稿复发压到可控范

文章图片
#java#开发语言#人工智能 +1
Agent 一接消息通知中心就开始批量误处理:从 Batch Claim 到 Target Proof 的工程实战

消息通知中心最容易被低估的,不是按钮难找,而是列表对象一直在漂移。Agent 刚清掉一条未读,列表就可能因为实时刷新、优先级插队或筛选联动而重排,下一次点击落到的已不是原目标。本文围绕消息通知中心批量误处理这个高频故障,拆解为什么“看见哪一行就处理哪一行”在生产里注定不稳,并给出一套可复现的工程约束:先用 Batch Claim 固定本轮处理集合,再用 Target Proof 对详情跳转、标记已

文章图片
#人工智能#深度学习
Agent 一接消息通知中心就开始批量误处理:从 Batch Claim 到 Target Proof 的工程实战

通知中心 Agent 最常见的事故不是不会点,而是批量处理时把未读、待办和高优先级消息一起误清。本文围绕 Batch Claim、Target Proof 与提交前回证,拆解为什么通知中心一旦进入自动化就容易误处理,并给出可直接落地的工程做法。

文章图片
#batch#开发语言#人工智能 +1
Agent 一接 MCP 就开始工具调用失控:从 Schema 治理到运行时契约校验的工程实战

MCP 协议让大模型 Agent 无缝接入外部工具,从数据库查询到文件操作,只需一份 JSON Schema 即可完成注册。然而生产环境中,工具数量超过 10 个后,Agent 频繁出现调用错误、参数类型失配、返回值解析失败等问题。这些故障并非模型能力不足,而是源于 Schema 描述的质量赤字与运行时校验的缺失。本文从 Schema 治理与运行时契约校验两个维度,结合生产环境真实数据与可复现代码

文章图片
#人工智能#深度学习#MCP
    共 111 条
  • 1
  • 2
  • 3
  • 12
  • 请选择