dingxie1963 个人主页

@dingxie1963

dingxie1963

2023-11-01 16:53:21 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AI Agent Runtime：从沙箱到事件日志的生产级架构演进

AI Agent 不再是简单调用大模型的脚本，而是具备状态、安全与可审计能力的长期运行系统。其核心在于 runtime 层——即承载工具调用、会话管理、凭证隔离与故障恢复的执行环境。随着 Anthropic Managed Agents、AWS Bedrock AgentCore 等产品成熟，‘session as durable event log’正成为生产级 agent 的事实标准，它将传统

用Python自动化Obsidian知识库：从文件操作到图谱重构

Obsidian作为基于纯文本的知识管理工具，其核心价值在于用户对数据的完全控制；而Python凭借强大的文件系统操作能力、YAML/Markdown解析生态及图论建模支持，成为实现知识库自动化运维的理想引擎。本文围绕Obsidian Vault的物理结构、Front Matter安全修改、双向链接语义解析、增量索引生成与外部数据ETL等关键技术展开，深入讲解如何用Python替代插件完成万级笔记

#python

零代码构建AI智能体：COZE可视化工作流实战指南

AI智能体（AI Agent）是当前人工智能领域的重要发展方向，它通过模块化设计和工作流驱动，使大语言模型从被动对话转向主动执行。其核心原理在于将复杂的任务分解为可规划、可执行的步骤，并调用外部工具（插件）完成闭环。这一技术价值在于显著降低了自动化流程的开发门槛，让非程序员也能构建实用的数字助手。典型的应用场景包括智能客服、内容自动生成、数据分析和跨系统业务流程自动化。本文以COZE平台为例，深入

#AI智能体 #工作流

Gemini长期记忆功能：私有化AI知识中枢实战指南

长期记忆（LTM）是大模型从‘即时问答’迈向‘持续认知’的关键能力，其核心在于将用户私有文档、偏好设定与领域知识结构化建模，而非依赖传统RAG的向量检索。相比本地部署的LangChain+向量库方案，Gemini记忆以人工语义锚定、意图-实体-关系存储和对话式协同交互，显著降低知识管理门槛，提升技术文档检索精度与跨文档推理能力。该能力特别适用于嵌入式开发、医疗研究、工业协议等强专业性场景，让工程师

警惕vibe coding：AI编程中的语义幻觉与工程底线

在AI辅助编程日益普及的今天，'vibe coding'正成为影响代码质量与系统稳定性的隐性风险。它并非指代某项技术，而是描述一种依赖直觉化prompt、忽视逻辑验证与上下文约束的开发惯性。其本质源于大语言模型的统计续写机制——易产生语义幻觉（如伪造JWT校验逻辑）、上下文窄化（忽略项目私有规范）及责任漂移（弱化工程师技术主权）。这类问题在TypeScript类型守卫、Redis缓存策略、微服务拆

AI Agent协同系统：用LangGraph构建新闻内容迭代生成闭环

AI Agent是大模型落地业务场景的核心范式，其本质是将人类专业工作流拆解为可编排、可验证、可回溯的智能体协作任务。LangGraph作为图状态机框架，通过明确定义输入/输出契约、结构化反馈机制与条件化流转逻辑，显著提升LLM应用在内容生成等复杂任务中的可控性与可信度。相比链式调用，图结构天然支持错误隔离、重试追踪与人工干预，特别适用于新闻摘要、批判性反馈、迭代优化等强质量要求场景。本文以财经简

GPT-4的1.8万亿参数与2%激活率真相：MoE稀疏架构深度解析

大语言模型的参数量与实际计算开销之间存在巨大鸿沟，其核心在于稀疏激活机制——混合专家（MoE）架构。MoE通过路由器动态选择少量专家子网络处理每个token，实现‘总参庞大、激活精简’的技术平衡。这种设计既缓解显存墙与计算墙压力，又支撑千卡级高效推理，已成为GPT-4、Qwen-MoE、Mixtral等主流大模型的标配。理解MoE的路由逻辑、激活率波动性及负载均衡机制，对模型部署、推理优化和私有化

Gemma 4架构解析：31B模型越级击败600B的三大核心技术

大语言模型性能不再单纯依赖参数规模，而转向结构设计、计算调度与数值表示的协同优化。混合专家（MoE）架构通过物理级硬路由实现按需激活，显著降低显存带宽压力；动态稀疏注意力（如GASP）使长上下文推理显存增长趋于线性，突破KV缓存瓶颈；量化感知训练（QATL）则将INT4从精度妥协升维为训练原生范式，重建数值稳定性。这些技术共同支撑了小参数模型在数学推理、多跳事实核查、低资源语言泛化等高阶任务上的企

Gemini图片生成拦截原因与提示词优化指南

AI图片生成并非简单输入输出，而是受多层内容安全策略约束的受控过程。其核心原理在于语义解析、风险扫描与上下文评估的实时协同，技术价值体现在保障可解释性、可追溯性与低法律风险。典型应用场景包括UI设计、营销素材生成与概念可视化，但需规避真实人物肖像、品牌标识、地理政治名称等高危信号。本文聚焦Gemini图片生成频繁拦截问题，结合‘gemini使用’实践与‘ai图片生成’通用逻辑，系统拆解提示词净化、

DeepSeek-V2：MoE架构落地的工程实践指南

混合专家（MoE）是一种突破传统稠密模型计算范式的稀疏化建模方法，其核心在于通过动态路由实现低激活参数量下的高表征能力。DeepSeek-V2作为当前最成熟的MoE大模型工程样本，以236B总参、仅21B激活参数的设计，在128K长上下文、FP8量化、消费级显卡部署等关键场景中展现出显著优势。它不仅验证了MoE在推理效率、训练稳定性与边缘适配上的技术价值，更推动了从‘堆参数’到‘编排专家’的范式转

共 17 条

请选择