logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM之幻觉(一):大语言模型幻觉解决方案综述

论文题目:《Cognitive Mirage: A Review of Hallucinations in Large Language Models》​论文链接:https://arxiv.org/abs/2309.06794v1论文代码:https://github.com/hongbinye/cognitive-mirage-hallucinations-in-llms由ChatGPT带来的

文章图片
#语言模型#人工智能#自然语言处理
LLM之Agent(四十七)|提升 Claude Code 效率的灵魂:CLAUDE.md 最佳实践指南

这是全文含金量最高的核心板块,直接决定AI能不能读懂你的项目底色、不跑偏开发方向。不用堆砌空话、不用铺垫品牌背景,只用直白简洁语言,说清4个核心关键信息就行。✅ 必写核心要点:产品核心定位、目标使用人群、核心迭代优化方向、硬性业务约束/UX体验红线;全程控制在3-5小段,精简干练最佳。❌ 千万别写:冗长品牌溯源故事、空泛价值口号、和代码落地无关的营销话术,只会干扰AI判断、稀释核心规则权重。项目概

文章图片
#人工智能#大数据#网络
LLM之Agent(四十九)|用 Claude Code 打造一套可落地的sub-agent团队工程体系

让 AI 代理像真正的工程团队一样工作。不是更快,而是更可预测。不是更多功能,而是更少 bug。不是更聪明,而是更有纪律。关键要点回顾:✅1% 规则— 只要 1% 概率适用,就必须调用技能✅硬门槛— 设计获批前不准写代码✅上下文隔离— 子代理不继承主代理的上下文✅TDD 铁律— 没看测试失败就不算 TDD✅双重评审— 规格合规 + 代码质量,顺序不能乱✅验证门— 没有新鲜证据就不准声称完成✅三修复

#人工智能
LLM之Agent(五十一)|揭秘 Anthropic Claude思维引擎背后的 62 个核心组件

执行轨迹作为一等产物:智能体的推理轨迹不是调试日志;它是可交付物。每轮运行产生完整轨迹,审查者可审计。完成定义契约:机器可检查的规范,在智能体开始工作前写好,智能体事后不能争辩。契约是真相来源;模型对自己工作的看法不覆盖契约的判决。},},},},},],},五条标准。三条精确或布尔,无回旋余地。一条中央预测目标 5% 容差。一条最终报告存在性检查。这个契约是信任之门。智能体完成第八阶段后不是宣称

文章图片
#人工智能
LLM之Agent(五十一)|揭秘 Anthropic Claude思维引擎背后的 62 个核心组件

执行轨迹作为一等产物:智能体的推理轨迹不是调试日志;它是可交付物。每轮运行产生完整轨迹,审查者可审计。完成定义契约:机器可检查的规范,在智能体开始工作前写好,智能体事后不能争辩。契约是真相来源;模型对自己工作的看法不覆盖契约的判决。},},},},},],},五条标准。三条精确或布尔,无回旋余地。一条中央预测目标 5% 容差。一条最终报告存在性检查。这个契约是信任之门。智能体完成第八阶段后不是宣称

文章图片
#人工智能
LLM之Agent(五十一)|揭秘 Anthropic Claude思维引擎背后的 62 个核心组件

执行轨迹作为一等产物:智能体的推理轨迹不是调试日志;它是可交付物。每轮运行产生完整轨迹,审查者可审计。完成定义契约:机器可检查的规范,在智能体开始工作前写好,智能体事后不能争辩。契约是真相来源;模型对自己工作的看法不覆盖契约的判决。},},},},},],},五条标准。三条精确或布尔,无回旋余地。一条中央预测目标 5% 容差。一条最终报告存在性检查。这个契约是信任之门。智能体完成第八阶段后不是宣称

文章图片
#人工智能
LLM之Agent(五十)|手把手教你用 Hermes Agent 搭建 AI 会议助手:从安装到代码全解析

Hermes Agent 是模型无关的:payload 使用,委托给你配置的提供商。通过运行从 Anthropic 切换到本地 Ollama 实例,只需改一个设置,应用代码完全不变。Responses API + store: True 是关键架构决策:通过服务端持久化响应,应用免费获得持久的会议历史。每次调用返回的成为该会议结构化输出的永久句柄,随时可通过检索。受益于学习闭环:Hermes 从复

文章图片
#人工智能
LLM之Agent(五十)|手把手教你用 Hermes Agent 搭建 AI 会议助手:从安装到代码全解析

Hermes Agent 是模型无关的:payload 使用,委托给你配置的提供商。通过运行从 Anthropic 切换到本地 Ollama 实例,只需改一个设置,应用代码完全不变。Responses API + store: True 是关键架构决策:通过服务端持久化响应,应用免费获得持久的会议历史。每次调用返回的成为该会议结构化输出的永久句柄,随时可通过检索。受益于学习闭环:Hermes 从复

文章图片
#人工智能
LLM之Agent(四十九)|用 Claude Code 打造一套可落地的sub-agent团队工程体系

让 AI 代理像真正的工程团队一样工作。不是更快,而是更可预测。不是更多功能,而是更少 bug。不是更聪明,而是更有纪律。关键要点回顾:✅1% 规则— 只要 1% 概率适用,就必须调用技能✅硬门槛— 设计获批前不准写代码✅上下文隔离— 子代理不继承主代理的上下文✅TDD 铁律— 没看测试失败就不算 TDD✅双重评审— 规格合规 + 代码质量,顺序不能乱✅验证门— 没有新鲜证据就不准声称完成✅三修复

#人工智能
LLM之Agent(四十八)|OpenAI 100万行代码零手写:2026年最重要的工程学科,不是写代码

当AI能写代码,工程师的价值在哪里?OpenAI用一场静默的革命给出了答案。

文章图片
#人工智能
    共 172 条
  • 1
  • 2
  • 3
  • 18
  • 请选择