logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

智能识别告警系统完整方案

本文提出了一套完整的智能识别告警系统方案,通过AI视觉技术实现违规行为自动检测。系统采用分层架构设计,包含前端采集、接入服务、AI推理、规则判定、告警推送等模块,支持厨师帽佩戴、违规洗澡、人员闯入等多场景识别。技术选型上采用YOLO系列目标检测模型,结合自定义规则引擎实现精准判定。系统具备闭环调优机制,通过难样本收集、模型微调实现持续优化。方案优势在于轻量易部署、场景可扩展、识别准确率自提升等特点

LLM Token 消耗与生产限流:从查看到落地的完整指南

本文提供了一套完整的LLM Token管理与限流方案,涵盖单次Token查看、生产环境限流配置和优化策略。主要内容包括:1)三种Token消耗查看方法(API响应、本地估算、平台控制台);2)生产环境Token限制原则(硬上限+软限制)和推荐配置标准;3)Token消耗组成分析及成本优化方向;4)Python实现的限流器示例;5)三大优化策略(上下文裁剪、缓存复用、模型分级)。文章强调合理限流对成

ReAct + Reflection 双循环机制:从原理到生产落地的完整指南

摘要:ReAct + Reflection 双循环机制解析 ReAct(推理+行动)已成为AI Agent的核心范式,通过"思考-行动-反馈"循环,让大模型主动获取外部信息完成任务。标准流程包含观测、推理、决策、执行和反馈五层闭环。生产落地需叠加次数熔断、规则强控、性能延时和成本管控四层工程保障。针对纯ReAct的局限性,引入Reflection(反思循环)形成双循环机制:ReAct向外推进任务,

EverMemOS Docker 运行环境搭建指南

EverMemOS Docker 环境搭建指南 本文介绍如何快速部署 EverMemOS 系统,这是一个基于 Docker 的容器化解决方案,集成了 MongoDB、Elasticsearch、Milvus 和 Redis 等服务。指南包含环境要求、安装步骤、关键配置说明以及各服务端口信息。通过简单的 docker-compose 命令即可完成所有依赖服务的启动,并提供了 uv 包管理器和环境变量

#docker#容器#运维
Elasticsearch各版本特性对比

本文概述了Elasticsearch 5.x到8.x各版本的主要特性差异。5.x版本存在较多breaking changes,6.x引入单mapping type限制和基于操作的恢复机制。7.x转向typeless API,优化搜索性能并支持可搜索快照。8.x强化安全默认配置,移除type API,重点发展向量检索和语义搜索能力。升级建议包括:阅读breaking changes文档、处理弃用AP

#elasticsearch#java#大数据
Celery 运行全链路详解:从 task.delay() 到结果回传

Celery 任务执行全链路解析 本文系统讲解了 Celery 分布式任务队列的核心运行机制: 核心组件:包括 Producer(任务发起)、Broker(消息中间件)、Worker(任务执行)、Result Backend(结果存储)和 Beat(定时调度)。 任务执行流程:详细拆解了从 task.delay() 调用到任务完成的完整链路,包括消息序列化、Broker 投递、Worker 消费执

#python
多模态场景:头巾误判为厨师帽 — 问题分析与调优指南

多模态识别调优指南:头巾与厨师帽区分 摘要:本文针对多模态大模型(如Qwen-VL)在识别头巾与厨师帽时出现的误判问题,提出系统性解决方案。问题本质在于类别边界不清和负样本不足,导致模型在低分辨率或遮挡情况下容易混淆。调优策略包括:1)改进任务定义为多分类+不确定选项;2)重点补充硬负样本数据(如各类头巾);3)采用LoRA指令微调与对比学习;4)结构化输出与置信度阈值设置。文章还提供了数据采集建

#大数据
大模型从根本上解决工具调用混乱与幻觉问题

本文提出了一套系统化解决方案,从根本上解决大模型在工具调用中的混乱和幻觉问题。文章指出问题根因在于决策与执行边界模糊、协议不规范、状态管理薄弱等。作者提出从"模型聪明"转向"系统可控"的治理思路,构建了五层治理框架:协议层统一调用规范、执行层严格中断控制、状态层维护结构化记忆、约束层强制证据绑定、评估层持续优化指标。推荐采用分阶段落地路径,先立协议再逐步完善

大模型从根本上解决工具调用混乱与幻觉问题

本文提出了一套系统化解决方案,从根本上解决大模型在工具调用中的混乱和幻觉问题。文章指出问题根因在于决策与执行边界模糊、协议不规范、状态管理薄弱等。作者提出从"模型聪明"转向"系统可控"的治理思路,构建了五层治理框架:协议层统一调用规范、执行层严格中断控制、状态层维护结构化记忆、约束层强制证据绑定、评估层持续优化指标。推荐采用分阶段落地路径,先立协议再逐步完善

LLM多轮对话优化方法_上下文_指代消解_记忆

本文提出了一套优化大模型多轮对话的解决方案,针对上下文窗口受限、指代理解不准等问题,设计了四个可组合的优化模块:上下文管理采用滑动窗口+关键摘要+状态跟踪;指代消解将模糊表述转换为具体实体;Prompt精细化通过结构化呈现和角色约束提升专注度;记忆机制实现跨会话个性化。方案强调先进行查询改写和状态更新,再生成回答的流程,并提供了验证指标。该组合方案能有效提升任务型对话的连贯性和准确性。

    共 20 条
  • 1
  • 2
  • 请选择