logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

别再用固定长度推理了:Kimi K2 告诉你,未来 AI Agent 必须会自评自测

月之暗面把它叫做"Thinking Agent",核心理念是"模型即 Agent"。简单说,这个模型不只是回答问题,它会主动思考、调用工具、再思考、再调用工具,像人解决复杂问题一样一步步推进。最夸张的是,它能在一个任务里连续执行 200 到 300 步工具调用,中间不需要人插手。比如你让它规划一次伦敦看 Coldplay 演唱会的行程,它会自己搜索演出信息、查日历、订机票、找 Airbnb、预订餐

文章图片
#人工智能
为什么说 ReAct 是 AI 智能体发展史上的分水岭?

ReAct 设计中最深刻的洞见在于,它坚持让推理和行动交替 (interleaved)进行,而不是像 Plan-and-Execute 那样分离 (separated)。正如之前分析的,分离式设计的主要缺陷在于其僵化性。交替模式的优势体现在“适应性”上:处理动态环境:世界是不断变化的。一个预先制定的计划很可能在执行中途就因为环境变化而失效。ReAct 的交替模式让 Agent 可以在每一步行动之后

#人工智能#前端
我做了个 AI 狼人杀:你一个人也能开局,还能围观大模型互喷斗蛐蛐

我已经很多年没在线下玩过狼人杀了。不是我不爱玩,是毕业之后凑齐 8 到 12 个人太难了:时间对不上、地点对不上、状态也对不上。狼人杀当然是社交游戏,但我真正念念不忘的,是只靠只言片语盘出真相的推理快感——以及人在桌上互相试探、互相带节奏、互相嘴硬的那股活气。。桌上除了我们俩,其他玩家全都是 AI。你随时随地开一局,能真的玩 10~20 分钟的完整对局;更有意思的是,你还能看大语言模型在高压博弈场

文章图片
#人工智能
给文科生的 Vibe Coding 上手指南:我们离把想法变成现实,还差多远?

Vibe Coding 不是银弹。它有能力天花板,搞不定真正复杂和创新的任务。它会产生低质量的代码,给未来的维护和调试埋下巨雷。它可能留下你意识不到的安全漏洞。认识到这些局限性,不是为了劝退你,而是为了让你能更理智、更清醒地使用这个工具。把它当成一个给你打下手的超能实习生,而不是一个可以全权委托的 CTO。你可以让它帮你快速盖起一座毛坯房,但房子的结构设计、水电线路的规划、以及最终的质量验收,必须

#人工智能
大家都在讨论的 AI Agent,到底是什么?

要理解 AI Agent,我们得先把它和我们已经很熟悉的东西做个比较,比如 ChatGPT 这样的聊天机器人。我们现在是怎么使用 ChatGPT 的?我们问一个问题,它给一个答案。我们让它写一段文案,它生成一段文字。这个过程,本质上是一种“一问一答”的对话模式。它是一个知识渊博、文笔流畅的“回答者”或“生成者”。但你有没有发现,它的所有动作,都局限在那个对话框里。你让它帮你订一张明天去上海的机票,

#人工智能
从开发到发布全流程教程,看完不踩坑!

在上一篇文章🧐什么是 MCP 服务?如何利用 cursor + MCP 快速将现有服务接入大模型?中 ,我介绍了一下 MCP 的概念以及如何快速搭建一个 MCP 服务,文中搭建了一个简单的示例在本地进行调试并顺利调用了工具。在将上篇文章中的示例项目进行完善并发布的过程中,我对搭建 MCP 服务有了新的心得,也踩了一些坑,这篇文章我将更详细的讲讲从 MCP 服务的开发到发布的全流程。

文章图片
#node.js#typescript
AI 的环保账,训练一个模型要用多少电?

前段时间看到一个数字,把我吓了一跳:训练 GPT-3 这个模型,总共消耗了 1,287 兆瓦时的电。这是什么概念?大概相当于 120 个美国家庭一年的用电量。我当时就想,这也太夸张了吧。但仔细想想,这几年 AI 发展得这么快,ChatGPT、Midjourney 这些工具我们每天都在用,背后得有多少服务器在运转?这笔环保账到底该怎么算,我觉得值得好好聊聊。

文章图片
#人工智能
AI 批量检查数千份技术文档,如何实现高效文档纠错?

摘要 本文介绍了一种利用AI批量检查并纠正文档错误的方法。作者发现公司多语言技术文档中存在拼写错误后,设计了一套自动化流程:将文档按行编号后输入AI模型(Deepseek),要求以JSON格式返回错误行号、原始内容、修正建议和错误类型。为提升准确性,作者优化了提示词设计并增加了原始内容校验机制,避免误改。最终实现了一个TypeScript脚本,可并发处理上千份Markdown文件,有效解决了人工检

文章图片
#人工智能
Claude Skills vs 手动管理 Prompt 文件:本质区别到底在哪?

提示词工程(Prompt Engineering):设计和优化单次输入给 AI 的文本上下文工程(Context Engineering):为 AI 设计和构建动态上下文的系统工程你是一个 Python 专家,请帮我写一个函数...系统提示词:你是一个 Python 专家用户输入:请帮我写一个函数...对话历史:[过去 5 轮对话]外部知识:[从代码库检索的相关代码]可用工具:[read_file

文章图片
#chrome#前端#人工智能 +1
代码搜索的终极较量:SWE-grep 如何用4轮并行搜索击败传统方案?

经过深入调研和思考,我对 SWE-grep 有了更全面的认识。SWE-grep 不是要替代 grep 或 RAG,而是在速度和智能之间找到了一个新的平衡点。它解决的核心问题是:通过专用模型和并行搜索达到速度与智能的权衡(接近前沿模型的质量 + 快 10 倍的速度);通过子 Agent 架构实现上下文窗口的经济性(避免中间结果污染主 Agent 的上下文);把搜索时间从分钟级降低到秒级带来流畅感的用

文章图片
#人工智能
    共 34 条
  • 1
  • 2
  • 3
  • 4
  • 请选择