logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen3.5-Small+QLoRA新闻分类实战:16G显存跑通轻量微调全流程

文本分类是自然语言处理中最基础且高频的工业级任务,其核心在于平衡模型能力、计算资源与业务时效性。随着大模型落地瓶颈凸显,小模型高效微调技术(如QLoRA)正成为边缘部署与垂直场景的首选方案——它通过4-bit量化、双量化补偿与低秩适配协同,在不牺牲精度的前提下大幅压缩显存占用。Qwen3.5-Small凭借中文政务语料预训练、完整词表兼容与架构精简特性,显著优于同参数量竞品;结合QLoRA后,可在

手搓OpenVINO文本生成API:零Docker、纯Python实现OpenAI兼容服务

OpenVINO是Intel推出的高性能推理引擎,专为CPU/GPU/集成显卡优化,其核心原理是将模型编译为硬件友好的中间表示(IR)并利用异步执行与内存共享提升吞吐。技术价值在于低资源开销、无GPU依赖、可部署于边缘设备或老旧笔记本——尤其适合7B级以下LLM的本地化落地。典型应用场景包括私有化AI助手、IDE插件后端、离线教育工具及AI编程协作者的轻量推理底座。本文聚焦OpenVINO Run

AI Agent Runtime层的“操作系统时刻”:Session-as-Event-Log架构解析

AI Agent并非简单调用大模型的脚本,而是一套需状态持久化、安全隔离与可追溯执行的工程系统。其核心挑战在于突破上下文窗口限制,避免静默幻觉与不可调试的失败——这正是Session-as-Event-Log设计要解决的根本问题。该模式将Agent每次思考、工具调用与用户交互序列化为只追加、不可变的结构化事件流,实现100%可审计的决策链、毫秒级故障恢复与跨环境一致性。它标志着AI工程栈重心从模型

AI Agent行为可观测性:破解推理漂移与工具幻觉的静默失效

AI Agent作为具备自主决策、多步推理和状态记忆的智能体,其运行稳定性远超传统API监控范畴。当LLM在真实交互中出现推理链漂移、工具调用幻觉等行为偏差时,系统往往无错误码、无告警、但业务结果持续劣化——这正是Agent行为失稳不可见的核心挑战。基于AgentOps方法论,需构建覆盖原始行为流、特征提取、动态基线、根因关联与业务影响的五层可观测体系,尤其聚焦推理深度、工具调用熵值等可量化行为指

DeepSeek-TS+:多产品时间序列预测的商业智能范式

多产品时间序列预测是供应链与营销决策的核心基础,其本质是建模产品间动态关联与外部扰动下的协同演化规律。传统方法受限于独立建模或粗粒度聚合,难以兼顾精度、可解释性与业务适配性。状态空间模型凭借对隐状态的连续建模能力,天然适合捕捉销售行为的时变注意力机制;而组相对策略优化则将预测校准转化为可追溯的业务逻辑比对过程。二者融合不仅提升预测准确率,更支撑新品冷启动、跨品类关联预警、实时补货响应等高价值场景。

GPT-4的8个专家不是8个模型:深度解析MoE混合专家架构

混合专家(MoE)是一种关键的大语言模型稀疏化架构,通过动态路由机制在单一大模型内激活专用子网络,兼顾参数规模与推理效率。其核心原理在于共享主干(如注意力层、词表)基础上,为前馈层配置多个独立权重的‘专家’,再由轻量级Router按输入内容实时选择Top-K专家协同计算。这种设计显著降低显存带宽压力,提升多任务泛化能力,已成为GPT-4、Mixtral等先进模型的底层支撑。在工程实践中,MoE直接

Claude 4.5实测:Benchmark高分≠API可用,Function-Calling微调与对齐落地真相

大语言模型的function calling能力正成为企业AI落地的核心接口,而model alignment则决定了其是否真正可控、可信。本文从基础概念切入——function calling本质是模型与系统间的结构化契约,alignment则是意图、安全与责任的动态平衡;其技术价值不在于提升单轮问答准确率,而在于保障多轮状态传递鲁棒性、噪声数据下的泛化稳定性,以及业务SLA可承诺性。典型应用场

从Coze到Dify:手把手构建电商AI智能体工作流实战

智能体(Agent)作为能够感知环境、决策并执行任务的AI程序实体,其核心原理在于通过编排工作流(Workflow),将复杂任务拆解为有序的推理与工具调用步骤。这项技术为业务自动化与智能化提供了关键价值,广泛应用于智能客服、内容生成与流程自动化等场景。本文聚焦于AI训练师与智能体工程师的核心技能,通过对比低代码平台Coze与开源框架Dify,详解如何设计并实现一个完整的“电商产品详情页生成”智能体

#工作流
AI Agent工程化实践:基于agency-agents框架构建数据分析智能体

AI Agent作为人工智能领域的关键技术,通过模拟人类思考与行动循环,实现了从任务理解到自主执行的智能化跃迁。其核心原理基于ReAct(推理-行动)模式,结合大语言模型的规划能力与工具调用机制,能够将复杂问题拆解为可执行步骤。这一技术价值在于显著提升自动化水平,将传统脚本的固定流程升级为动态适应场景的智能工作流。在应用场景上,AI Agent广泛应用于数据分析、自动化报告生成、智能客服、代码辅助

基于AI Agent与多智能体协作的价值投资分析系统构建实战

AI Agent(人工智能智能体)是能够感知环境、自主决策并执行任务以实现特定目标的软件实体。其核心原理在于结合大型语言模型的推理能力与外部工具调用,形成可编程的自动化工作流。在技术价值上,AI Agent通过将复杂任务分解、分配与协同,显著提升了分析流程的结构化、自动化与可解释性,尤其适用于处理海量、多源信息的场景。多智能体协作机制进一步扩展了这一价值,通过模拟团队分工与讨论,能够完成单一智能体

    共 19 条
  • 1
  • 2
  • 请选择