logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI服务的“幽灵错误”:缓存污染+对话历史污染的排查与治理

本文记录了一个AI服务异常排查案例:当PythonAI服务因网络抖动短暂不可用后,系统却持续返回"AI服务暂时不可用"的错误提示。经排查发现是"对话历史污染"和"Redis缓存污染"两个bug叠加导致——错误信息既被存入对话历史误导LLM,又被缓存持久化。作者提出了四层防护方案:1)Python端清洗对话历史并强化Prompt;2)Jav

文章图片
#人工智能#java#缓存
从回车到页面:www.baidu.com 的“寻址漂流记”

文章摘要: 本文以访问www.baidu.com为例,详解DNS解析的完整流程:从浏览器缓存→操作系统缓存(含/etc/hosts优先级)→本地DNS服务器→根DNS/顶级域/权威DNS的层级查询,并通过dig +trace命令可视化验证。在Java开发中,InetAddress.getByName()会遵循此流程,但需注意JVM的DNS缓存机制(默认成功缓存30秒)及/etc/hosts的优先性

文章图片
#学习#java
一文搞懂:云原生与12要素应用——从服务网格到云时代开发“宪法”

云原生是一套为云计算环境设计的技术体系和方法论,强调应用从设计之初就适配云的弹性、分布式等特性。其核心包括容器化、微服务、DevOps等技术,以及12要素应用等规范。云原生并非简单将应用迁移到云上,而是通过架构设计充分利用云平台能力。阿里云、腾讯云等厂商提供容器服务等云原生基础设施,但使用云服务器≠云原生。云原生应用可运行在任何服务器上,关键在于架构设计而非部署位置。云原生通过标准化技术栈,使应用

文章图片
#云原生
MCP是AI的“手”,Skills是AI的“脑回路”——一个都不能少

本文探讨了AgentSkills与MCP的关系及其在AI架构中的角色。Skills起源于1999年的强化学习选项框架,经2023年Voyager项目实现代码化突破,到2025年由Anthropic标准化推广。Skills采用三层加载机制,通过文件夹形式封装专业知识,解决大模型"知道但不会做"的问题。与MCP的关系是分工协作而非替代:MCP提供外部连接能力,Skills定义具体执

文章图片
#人工智能#软件工程#后端
从多模态到模型之争:Java开发者的AI认知升级与转型指南

《Java开发者如何把握AI浪潮:从多模态认知到转型路径》 本文为Java开发者解析AI时代的核心概念与转型策略。首先阐释多模态AI的技术演进,比较ChatGPT与DeepSeek在架构、性能和商业模式上的差异。重点指出Java开发者在AI落地中的独特优势:80%企业系统采用Java架构,78%AI岗位要求Java技能。文章提供三步转型路径:1)夯实Java基础;2)掌握SpringAI等框架;3

文章图片
#java#人工智能#开发语言 +2
三款AI编程工具深度对决:Cursor、Claude Code与OpenClaw,谁才是你的“编程搭档”?

2026年AI编程工具三巨头对比:Cursor、ClaudeCode和OpenClaw各有侧重。Cursor是嵌入式AI IDE,擅长代码补全和实时协作;ClaudeCode作为终端代理,对复杂项目理解力强,适合架构级重构;OpenClaw则是任务执行中枢,能真正操作电脑完成任务。三者互补而非替代:Cursor提升日常编码效率,ClaudeCode处理深度代码分析,OpenClaw实现自动化执行。

文章图片
#后端#软件工程#java
一文搞懂:AI编程辅助工具——从GitHub Copilot到通义灵码,不同人群如何驾驭AI编程助手?

《AI编程工具的正确打开方式》摘要:当前AI编程工具呈现"双极多强"格局,85%开发者定期使用AI辅助编程。研究发现AI生成代码在复杂工程任务中正确率仅23%,存在语言表现差异和安全风险(如提示注入、密钥泄露等)。针对不同人群提出建议:在校生应避免依赖AI完成作业,将其作为学习导师;实习生需利用AI提升代码质量;资深开发者可让AI处理重复任务,专注架构设计。未来趋势是人主导的A

文章图片
#copilot#后端#人工智能
长上下文模型(1M token)会杀死RAG吗?—— 理性分析

摘要: 随着Gemini 1.5 Pro、Claude 3等模型支持百万级token上下文,有人认为长上下文模型将取代RAG(检索增强生成)。但实际分析表明,长上下文模型存在四大硬伤:高昂成本(如GPT-4 Turbo处理500K token需5美元/次)、延迟问题(O(n²)复杂度)、注意力稀释(关键信息易遗漏)和知识更新困难。相比之下,RAG在成本、实时性、可解释性上优势显著,尤其适合企业级场

文章图片
#人工智能#后端
1M上下文 vs RAG:理性分析为什么Agent时代两者必须共存

本文探讨了Gemini1.5 Pro的1M长上下文窗口与RAG技术的辩证关系。长上下文模型适合处理全局性任务(如整本合同分析),但存在成本高、更新难等问题;RAG则凭借低成本、高精度和动态更新优势,在精准检索场景表现更优。在Agent时代,两者呈现互补关系:RAG负责海量数据的快速筛选,长上下文模型进行深度推理。实践证明,混合架构能兼顾效率与质量,如财报分析场景需先用RAG定位关键信息,再交给长上

文章图片
#python#java#人工智能 +1
AI Agent下半场:模型能力过剩,Skill生态成为新壁垒

2026年AI行业迎来重大范式转变:模型能力趋同导致竞争焦点转向Skill生态。大模型API价格两极分化(OpenAI GPT-5.5 Pro达180美元/百万Token),而Agent工作流的Token消耗激增10倍以上。Skill作为封装专业知识的可复用模块,通过三层渐进式披露机制优化Token成本,全球Skill数量已超8.5万。SpringAI等框架已支持Skill开发,Java开发者可通

文章图片
#人工智能
    共 90 条
  • 1
  • 2
  • 3
  • 9
  • 请选择