霍风风个人主页

@weixin_32181267

霍风风

2023-08-23 16:30:09 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

LangChain聊天机器人记忆实现：ConversationBufferWindowMemory实战指南

聊天机器人的‘记忆’能力是其从单次问答工具升级为连续对话协作者的核心基础。其本质是在LLM上下文窗口约束下，对历史对话进行可控、高效、安全的上下文管理。关键技术原理包括Token预算控制、成本敏感设计与语义相关性筛选；典型技术价值体现在提升用户体验一致性、降低API调用成本、增强业务逻辑连贯性；广泛应用于客服助手、知识库问答、内部流程机器人等需多轮交互的场景。本文聚焦LangChain框架下的Ch

MuleSoft集成大语言模型的企业级AI编排实践

大语言模型（LLM）作为新一代智能引擎，其真正价值在于与企业核心系统深度协同，而非孤立调用。实现这一目标需突破安全管控、数据治理、服务可靠性三大瓶颈——这正是企业级API管理与集成平台的核心使命。MuleSoft凭借统一API治理、异步消息可靠传递、DataWeave数据编织及全链路可观测性，将非结构化LLM输出精准映射为SAP、Salesforce等系统的结构化指令，同时满足GDPR、等保三级等

5步构建可落地的AI Agent：从目标定义到业务评估

AI Agent并非大模型的简单调用，而是面向任务的智能体工程——它以任务分解为起点，依托工具调用实现执行闭环，通过LLM orchestration协调多步骤决策流。其核心价值在于将模糊业务需求转化为可验证、可监控、可迭代的数字员工行为，显著提升人机协作ROI。典型应用场景覆盖电商客服自动应答、教育个性化解题、工业设备异常诊断等需结构化决策与系统集成的领域。本文聚焦‘Define Goal→Se

国内开发者如何合规调用Gemini 3.5 Flash API

大语言模型API调用是当前AI工程落地的核心环节，其本质涉及认证机制、区域部署、请求协议与生产级配置四大基础维度。Gemini 3.5 Flash并非仅限于图形化界面体验，而是以Google Cloud Platform（GCP）为唯一合规生产入口，依托Service Account密钥、v1beta版本API、us-central1区域部署等关键技术要素实现稳定访问。该模型突出多任务并行与低延迟

OpenCode + Ollama本地AI编程实战：模型对齐、服务配置与三阶段加载

本地大模型编程工具链正成为开发者新刚需，其核心并非单一IDE插件，而是‘前端界面+模型服务+协议适配’的协同系统。OpenCode作为轻量级AI编程代理容器，依赖Ollama提供模型推理、显存调度与API标准化能力；二者间需完成连接层（主机/端口）、协议层（模型名/上下文长度）和语义层（提示模板）三层通信契约对齐。常见卡顿、报错或无响应，多源于Ollama未就绪、镜像源配置缺失、模型命名不规范或G

#Ollama

Gemini3.0如何重塑硕博答辩PPT的逻辑表达与认知可读性

学术汇报正从单向信息传递升维为多维认知共建，其核心已不再是内容正确性，而是逻辑可追溯性、术语可理解性与表达可证伪性。PPT作为学术思维的外化载体，本质是面向评审的认知路标系统，需满足结构清晰、因果闭环、术语解耦三大基础要求。Gemini3.0凭借多模态联合推理与分层注意力机制，成为首个能对PPT实施‘手术刀级’逻辑断层检测、追问预判与术语解耦的AI工具，显著提升学术表达的严谨性与受众适配度。本文聚

Claude 3.5 Sonnet实战指南：轻量级AI工作流搭建与避坑手册

大语言模型（LLM）的推理能力正从参数规模导向转向工程可用性导向。Claude 3.5 Sonnet作为当前综合性能最均衡的主力模型，凭借200K上下文、高鲁棒性工具调用、语义对齐适配器等关键技术，在长文本处理、中文理解与企业级稳定性方面展现出显著优势。其价值不在于‘小模型’标签，而在于将复杂推理能力封装为可预测、可集成、可降级的确定性服务。本文围绕真实生产场景，详解如何基于Claude 3.5

国内合规使用Gemini 3.1 Pro的三种可行路径

大语言模型（LLM）作为当前AI应用的核心技术载体，其服务可用性高度依赖区域部署与API治理策略。Gemini 3.1 Pro作为Google DeepMind推出的多模态旗舰模型，具备200万token长上下文、强代码生成与可控思维链等关键技术特性，但其在中国大陆未开放官方API直连通道，也无本地化服务节点。因此，实际‘使用’本质是围绕数据安全、网络合规与工程落地三重约束展开的服务边界适配。典型

Autogen多智能体金融分析实战：比特币vs特斯拉量化对比

AI智能体（Agentic AI）是大模型落地专业领域的关键范式，其核心在于将单一大模型的模糊推理，转化为多个角色明确、接口清晰、工具可控的协作单元。在金融分析场景中，这种架构天然适配投研所需的可审计性、可复现性与责任可追溯性。Autogen作为轻量级多智能体框架，通过角色定义、对话编排、工具约束与反思机制，有效规避了单模型在时效性、归因逻辑和结果溯源上的结构性缺陷。本文以比特币与特斯拉股票的六维

Harness Design：AI编程的工程化控制台与七层架构

Harness Design是一种将大语言模型纳入可控软件工程体系的方法论，核心在于把AI交互从不可追溯的‘黑箱调用’升级为具备状态管理、安全约束与效果评估的可设计系统。其原理源于分布式系统设计思想，通过任务契约、上下文隔离、工具白名单、状态机驱动等机制，实现对AI行为的可观测、可验证与可回滚。该技术显著提升AI在知识沉淀、定义精炼、规则引擎等长周期、高可靠性场景中的落地能力，尤其适用于需要多轮迭

共 82 条

请选择