weixin_33671935 个人主页

@weixin_33671935

weixin_33671935

2023-08-16 17:03:05 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从零手写AI智能体：Kimi-2.5驱动的股票分析工程实践

AI智能体不是调用大模型API的简单问答系统，而是具备状态管理、工具编排、结构化记忆与可审计决策链的工程化系统。其核心原理在于将大模型（如Kimi-2.5）定位为‘计划生成器’，由轻量调度器执行确定性动作，实现金融场景所需的高可控性、低幻觉与强溯源能力。技术价值体现在对工具调用时序、错误语义分级、记忆结构化建模的深度定制，显著优于通用框架（如LangChain）在合规性、响应延迟与业务适配上的局限

蓝桥杯Java备赛真相：破除100题迷思，构建能力三维坐标系

蓝桥杯Java组并非传统算法竞赛，而是一场对Java语言深度、算法建模粒度与工程精度的综合检验。其本质是考察在严格资源约束下，将业务需求精准映射为数学模型与JDK API调用的能力。题目高频依赖JDK标准库语义（如DateTimeFormatter、ConcurrentHashMap.computeIfAbsent）、数学推导（L1类公式解）及API边界行为（如BigInteger.multipl

Codex不是软件：揭秘AI编程能力的真相与2024实战工具链

大语言模型的代码生成能力是开发者关注的核心技术概念，其原理源于专用代码预训练与上下文理解机制，具备显著的技术价值——可大幅提升编码效率、降低调试成本、增强代码可维护性。典型应用场景包括IDE智能补全、错误自动修复、函数级重构及文档生成等。随着GPT-4 Turbo、DeepSeek-Coder、CodeLlama等模型演进，‘Codex’作为早期OpenAI代码模型已停止维护，其能力被深度整合进主

Gemini科研协作方法论：从模型能力到可复现工作流

大语言模型（LLM）正深度融入科研实践，其核心价值在于提升研究效率与结果可复现性。Gemini作为谷歌推出的先进AI模型，依托1.5系列架构，在多模态理解、长上下文推理和工具调用方面具备显著技术优势。其真正价值不在于独立软件形态，而在于与Chrome等原生环境的轻量集成，以及对科研工作流中提问精度、代码生成、图表规范、学术伦理等关键环节的系统性增强。本文聚焦科研人员高频痛点——如‘not elig

Gemini 3.1 Pro 官方使用渠道全解析：五条链路、认证逻辑与避坑指南

大语言模型（LLM）API 调用的核心前提是理解其认证体系与服务分发架构。Gemini 作为 Google 推出的旗舰级生成式AI模型，其3.1 Pro版本并非统一部署，而是采用分发式架构——不同官方渠道（如AI Studio、Vertex AI、CLI、Chrome集成、IDE插件）对应独立的认证机制、权限模型、endpoint路径及配额体系。这种设计虽提升安全性与可控性，却导致开发者频繁遭遇‘

DeepSeek落地关键链路：中文工程化中的确定性设计

在AI模型工程化落地过程中，'确定性'比'先进性'更决定系统可用性——它指模型在真实中文场景下对输入扰动、硬件波动和网络异常的可预期响应能力。其核心原理在于将不确定性因素（如标点歧义、KV Cache碎片、TTFT抖动）转化为可控机制，技术价值体现在降低运维成本、提升首字延迟稳定性与合规通过率。典型应用场景包括金融客服RAG服务、政务热线知识库及制造业质检报告生成等需高可靠流式输出的业务。本文聚焦

#DeepSeek

Claude Managed Agents深度解析：Session-as-Event-Log架构与企业级Agent工程实践

Agent runtime 是支撑大模型智能体落地的核心基础设施，其本质是解决状态管理、执行可靠性和合规可控三大工程难题。传统基于LLM上下文窗口的状态存储易导致静默错误（silent corruption），而Session-as-Event-Log范式将状态外置为持久化、可审计、可重放的结构化事件日志，显著提升因果一致性与调试能力；Harness协议则通过标准化tool调用契约（execute

Agent五大设计模式：Prompt Chaining、ReAct、Plan-and-Execute等工程落地指南

Agent设计模式是AI工程化的核心方法论，本质是将软件工程中成熟的抽象、分层与契约思想迁移至大模型工作流。其原理在于通过结构化任务分解（如Prompt Chaining）、显式推理-执行闭环（ReAct）、计划与执行物理隔离（Plan-and-Execute）等机制，约束LLM的不确定性，提升可控性、可测试性与可审计性。技术价值体现在降低线上抖动、加速故障定位、支撑合规审查，广泛应用于金融风控、

GLM-5.1国产大模型8小时持续推理技术解析

大语言模型的长时稳定推理能力，是衡量其工程落地价值的核心指标。不同于传统Benchmark关注单次响应质量，真实办公场景更依赖模型在长时间、多轮次、高上下文下的状态一致性与资源可控性。GLM-5.1通过KV Cache分块预分配、动态稀疏计算调度和原子化状态持久化三大关键技术，首次在消费级显卡（如RTX 4060）上实现128K上下文下的8小时无中断推理，显著提升中文长文本理解与生成的可靠性。该能

深度学习最常见的 26 个模型汇总，请务必掌握！

点击上方“AI有道”，选择“置顶”公众号重磅干货，第一时间送达本文转载自公众号：AI部落联盟（AI_Tribe）本文首先从4个方面（张量、生成模型、序列学习、深度强化学习...

共 61 条

请选择