高考化学赵夫子个人主页

@weixin_29039773

高考化学赵夫子

2023-08-16 17:05:12 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen3.5-Small+QLoRA新闻分类实战：16G显存跑通轻量微调全流程

文本分类是自然语言处理中最基础且高频的工业级任务，其核心在于平衡模型能力、计算资源与业务时效性。随着大模型落地瓶颈凸显，小模型高效微调技术（如QLoRA）正成为边缘部署与垂直场景的首选方案——它通过4-bit量化、双量化补偿与低秩适配协同，在不牺牲精度的前提下大幅压缩显存占用。Qwen3.5-Small凭借中文政务语料预训练、完整词表兼容与架构精简特性，显著优于同参数量竞品；结合QLoRA后，可在

手搓OpenVINO文本生成API：零Docker、纯Python实现OpenAI兼容服务

OpenVINO是Intel推出的高性能推理引擎，专为CPU/GPU/集成显卡优化，其核心原理是将模型编译为硬件友好的中间表示（IR）并利用异步执行与内存共享提升吞吐。技术价值在于低资源开销、无GPU依赖、可部署于边缘设备或老旧笔记本——尤其适合7B级以下LLM的本地化落地。典型应用场景包括私有化AI助手、IDE插件后端、离线教育工具及AI编程协作者的轻量推理底座。本文聚焦OpenVINO Run

AI Agent Runtime层的“操作系统时刻”：Session-as-Event-Log架构解析

AI Agent并非简单调用大模型的脚本，而是一套需状态持久化、安全隔离与可追溯执行的工程系统。其核心挑战在于突破上下文窗口限制，避免静默幻觉与不可调试的失败——这正是Session-as-Event-Log设计要解决的根本问题。该模式将Agent每次思考、工具调用与用户交互序列化为只追加、不可变的结构化事件流，实现100%可审计的决策链、毫秒级故障恢复与跨环境一致性。它标志着AI工程栈重心从模型

AI Agent行为可观测性：破解推理漂移与工具幻觉的静默失效

AI Agent作为具备自主决策、多步推理和状态记忆的智能体，其运行稳定性远超传统API监控范畴。当LLM在真实交互中出现推理链漂移、工具调用幻觉等行为偏差时，系统往往无错误码、无告警、但业务结果持续劣化——这正是Agent行为失稳不可见的核心挑战。基于AgentOps方法论，需构建覆盖原始行为流、特征提取、动态基线、根因关联与业务影响的五层可观测体系，尤其聚焦推理深度、工具调用熵值等可量化行为指

DeepSeek-TS+：多产品时间序列预测的商业智能范式

多产品时间序列预测是供应链与营销决策的核心基础，其本质是建模产品间动态关联与外部扰动下的协同演化规律。传统方法受限于独立建模或粗粒度聚合，难以兼顾精度、可解释性与业务适配性。状态空间模型凭借对隐状态的连续建模能力，天然适合捕捉销售行为的时变注意力机制；而组相对策略优化则将预测校准转化为可追溯的业务逻辑比对过程。二者融合不仅提升预测准确率，更支撑新品冷启动、跨品类关联预警、实时补货响应等高价值场景。

GPT-4的8个专家不是8个模型：深度解析MoE混合专家架构

混合专家（MoE）是一种关键的大语言模型稀疏化架构，通过动态路由机制在单一大模型内激活专用子网络，兼顾参数规模与推理效率。其核心原理在于共享主干（如注意力层、词表）基础上，为前馈层配置多个独立权重的‘专家’，再由轻量级Router按输入内容实时选择Top-K专家协同计算。这种设计显著降低显存带宽压力，提升多任务泛化能力，已成为GPT-4、Mixtral等先进模型的底层支撑。在工程实践中，MoE直接

Claude 4.5实测：Benchmark高分≠API可用，Function-Calling微调与对齐落地真相

大语言模型的function calling能力正成为企业AI落地的核心接口，而model alignment则决定了其是否真正可控、可信。本文从基础概念切入——function calling本质是模型与系统间的结构化契约，alignment则是意图、安全与责任的动态平衡；其技术价值不在于提升单轮问答准确率，而在于保障多轮状态传递鲁棒性、噪声数据下的泛化稳定性，以及业务SLA可承诺性。典型应用场

从Coze到Dify：手把手构建电商AI智能体工作流实战

智能体（Agent）作为能够感知环境、决策并执行任务的AI程序实体，其核心原理在于通过编排工作流（Workflow），将复杂任务拆解为有序的推理与工具调用步骤。这项技术为业务自动化与智能化提供了关键价值，广泛应用于智能客服、内容生成与流程自动化等场景。本文聚焦于AI训练师与智能体工程师的核心技能，通过对比低代码平台Coze与开源框架Dify，详解如何设计并实现一个完整的“电商产品详情页生成”智能体

#工作流

AI Agent工程化实践：基于agency-agents框架构建数据分析智能体

AI Agent作为人工智能领域的关键技术，通过模拟人类思考与行动循环，实现了从任务理解到自主执行的智能化跃迁。其核心原理基于ReAct（推理-行动）模式，结合大语言模型的规划能力与工具调用机制，能够将复杂问题拆解为可执行步骤。这一技术价值在于显著提升自动化水平，将传统脚本的固定流程升级为动态适应场景的智能工作流。在应用场景上，AI Agent广泛应用于数据分析、自动化报告生成、智能客服、代码辅助

基于AI Agent与多智能体协作的价值投资分析系统构建实战

AI Agent（人工智能智能体）是能够感知环境、自主决策并执行任务以实现特定目标的软件实体。其核心原理在于结合大型语言模型的推理能力与外部工具调用，形成可编程的自动化工作流。在技术价值上，AI Agent通过将复杂任务分解、分配与协同，显著提升了分析流程的结构化、自动化与可解释性，尤其适用于处理海量、多源信息的场景。多智能体协作机制进一步扩展了这一价值，通过模拟团队分工与讨论，能够完成单一智能体

共 19 条

请选择