logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从零手写AI智能体:Kimi-2.5驱动的股票分析工程实践

AI智能体不是调用大模型API的简单问答系统,而是具备状态管理、工具编排、结构化记忆与可审计决策链的工程化系统。其核心原理在于将大模型(如Kimi-2.5)定位为‘计划生成器’,由轻量调度器执行确定性动作,实现金融场景所需的高可控性、低幻觉与强溯源能力。技术价值体现在对工具调用时序、错误语义分级、记忆结构化建模的深度定制,显著优于通用框架(如LangChain)在合规性、响应延迟与业务适配上的局限

蓝桥杯Java备赛真相:破除100题迷思,构建能力三维坐标系

蓝桥杯Java组并非传统算法竞赛,而是一场对Java语言深度、算法建模粒度与工程精度的综合检验。其本质是考察在严格资源约束下,将业务需求精准映射为数学模型与JDK API调用的能力。题目高频依赖JDK标准库语义(如DateTimeFormatter、ConcurrentHashMap.computeIfAbsent)、数学推导(L1类公式解)及API边界行为(如BigInteger.multipl

Codex不是软件:揭秘AI编程能力的真相与2024实战工具链

大语言模型的代码生成能力是开发者关注的核心技术概念,其原理源于专用代码预训练与上下文理解机制,具备显著的技术价值——可大幅提升编码效率、降低调试成本、增强代码可维护性。典型应用场景包括IDE智能补全、错误自动修复、函数级重构及文档生成等。随着GPT-4 Turbo、DeepSeek-Coder、CodeLlama等模型演进,‘Codex’作为早期OpenAI代码模型已停止维护,其能力被深度整合进主

Gemini科研协作方法论:从模型能力到可复现工作流

大语言模型(LLM)正深度融入科研实践,其核心价值在于提升研究效率与结果可复现性。Gemini作为谷歌推出的先进AI模型,依托1.5系列架构,在多模态理解、长上下文推理和工具调用方面具备显著技术优势。其真正价值不在于独立软件形态,而在于与Chrome等原生环境的轻量集成,以及对科研工作流中提问精度、代码生成、图表规范、学术伦理等关键环节的系统性增强。本文聚焦科研人员高频痛点——如‘not elig

Gemini 3.1 Pro 官方使用渠道全解析:五条链路、认证逻辑与避坑指南

大语言模型(LLM)API 调用的核心前提是理解其认证体系与服务分发架构。Gemini 作为 Google 推出的旗舰级生成式AI模型,其3.1 Pro版本并非统一部署,而是采用分发式架构——不同官方渠道(如AI Studio、Vertex AI、CLI、Chrome集成、IDE插件)对应独立的认证机制、权限模型、endpoint路径及配额体系。这种设计虽提升安全性与可控性,却导致开发者频繁遭遇‘

DeepSeek落地关键链路:中文工程化中的确定性设计

在AI模型工程化落地过程中,'确定性'比'先进性'更决定系统可用性——它指模型在真实中文场景下对输入扰动、硬件波动和网络异常的可预期响应能力。其核心原理在于将不确定性因素(如标点歧义、KV Cache碎片、TTFT抖动)转化为可控机制,技术价值体现在降低运维成本、提升首字延迟稳定性与合规通过率。典型应用场景包括金融客服RAG服务、政务热线知识库及制造业质检报告生成等需高可靠流式输出的业务。本文聚焦

#DeepSeek
Claude Managed Agents深度解析:Session-as-Event-Log架构与企业级Agent工程实践

Agent runtime 是支撑大模型智能体落地的核心基础设施,其本质是解决状态管理、执行可靠性和合规可控三大工程难题。传统基于LLM上下文窗口的状态存储易导致静默错误(silent corruption),而Session-as-Event-Log范式将状态外置为持久化、可审计、可重放的结构化事件日志,显著提升因果一致性与调试能力;Harness协议则通过标准化tool调用契约(execute

Agent五大设计模式:Prompt Chaining、ReAct、Plan-and-Execute等工程落地指南

Agent设计模式是AI工程化的核心方法论,本质是将软件工程中成熟的抽象、分层与契约思想迁移至大模型工作流。其原理在于通过结构化任务分解(如Prompt Chaining)、显式推理-执行闭环(ReAct)、计划与执行物理隔离(Plan-and-Execute)等机制,约束LLM的不确定性,提升可控性、可测试性与可审计性。技术价值体现在降低线上抖动、加速故障定位、支撑合规审查,广泛应用于金融风控、

GLM-5.1国产大模型8小时持续推理技术解析

大语言模型的长时稳定推理能力,是衡量其工程落地价值的核心指标。不同于传统Benchmark关注单次响应质量,真实办公场景更依赖模型在长时间、多轮次、高上下文下的状态一致性与资源可控性。GLM-5.1通过KV Cache分块预分配、动态稀疏计算调度和原子化状态持久化三大关键技术,首次在消费级显卡(如RTX 4060)上实现128K上下文下的8小时无中断推理,显著提升中文长文本理解与生成的可靠性。该能

深度学习最常见的 26 个模型汇总,请务必掌握!

点击上方“AI有道”,选择“置顶”公众号重磅干货,第一时间送达本文转载自公众号:AI部落联盟(AI_Tribe)本文首先从4个方面(张量、生成模型、序列学习、深度强化学习...

    共 61 条
  • 1
  • 2
  • 3
  • 7
  • 请选择