logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ollama+LLM llama3.1 部署教程(cpu版)

使用GPU需要安装 NVIDIA Container Toolkit⁠: https://hub.docker.com/r/ollama/ollama。有些大佬已经把几乎所有主流开源模型的gguf量化模型都整理好了,比如https://hf-mirror.com/bartowski。如果想使用Qwen2.5-7B模型,可以在这个模型页选择适合自己算力需求的模型下载。ollama create#从模

#linux#docker
【企业级龙虾】OpenClaw Skills 动态加载架构深度解析:几百个 Skills 如何可控挂载到上下文

OpenClaw的Skill管理采用分层漏斗机制优化性能与成本:通过多来源发现(workspace/managed/bundled等)、来源内限流(默认200个)、资格过滤(enabled/条件检查)、优先级合并(同名覆盖)和模型挂载预算(150个+30k字符)五层筛选,避免全量加载导致的token爆炸和模型噪音。该架构将技能系统从文件目录问题升级为运行时策略问题,支持动态刷新,并通过源码分析证实

#架构
【企业级龙虾】LLM Gateway 工程化落地:配置中心、429故障转移与统计持久化实战

本文分享了将LLM Gateway Lite项目从本地开发打磨到可开源发布的完整实战经验。文章重点介绍了10个关键改造环节:1)明确网关目标功能;2)本地Docker启动配置;3)管理后台重构;4)配置中心可视化与版本管理;5)链式轮询路由策略实现;6)流式/非流式429故障转移测试;7)统计窗口数据准确性优化;8)统计持久化方案;9)开源前的全面脱敏清理;10)合理的提交策略。作者强调,工程化改

#gateway
【企业级龙虾】LLM Gateway 工程化落地:配置中心、429故障转移与统计持久化实战

本文分享了将LLM Gateway Lite项目从本地开发打磨到可开源发布的完整实战经验。文章重点介绍了10个关键改造环节:1)明确网关目标功能;2)本地Docker启动配置;3)管理后台重构;4)配置中心可视化与版本管理;5)链式轮询路由策略实现;6)流式/非流式429故障转移测试;7)统计窗口数据准确性优化;8)统计持久化方案;9)开源前的全面脱敏清理;10)合理的提交策略。作者强调,工程化改

#gateway
【企业级龙虾】OpenClaw Bash/SH Wrapper 环境变量持久化

本文介绍了在多租户OpenClaw容器集群中实现环境变量持久化的解决方案。针对200个用户容器存在的环境变量丢失问题,提出了通过init层+shell wrapper实现自动快照回写的方案。该方案在不修改OpenClaw核心代码的前提下,实现了环境变量的自动捕获、增量落盘和重启恢复功能。关键设计包括:启动时加载持久变量、Bash Wrapper自动快照、增量回写避免文件膨胀等。方案通过统一&quo

【AI智能体】Claude Code 核心系统提示词深度解析

本文档总结了Claude Code项目中AI工具使用的核心系统提示词设计模式。采用分布式架构,每个Agent、Command和Skill都有独立提示词,但遵循统一设计规范。核心提示词分为四类模式:分析类(识别代码问题)、生成类(创建高质量代码)、验证类(确保代码质量)和编排类(协调复杂任务)。工具使用遵循优先级顺序:专用工具>搜索工具>交互工具>命令执行,强调安全性和语义清晰度。

#人工智能#架构
FunASR搭建语音识别服务和VAD检测

该服务使用阿里达摩院的模型,并支持SSL连接、2pass模式以及语音热词处理。你还需要从阿里云上下载相关的语音识别模型、VAD模型、标点符号模型等。这些模型是由达摩院发布的,具体的模型目录稍后会在启动命令中给出。这样,你的VAD模型将在600毫秒后检测到结束静音,适用于需要更快速响应的语音识别场景。的VAD参数,你可以根据具体需求定制VAD的检测灵敏度和时长。这些参数控制了VAD的静音检测、语音与

文章图片
#语音识别#人工智能
【大模型】自动化问答生成:使用GPT-3.5将文档转化为问答对

通过这个教程,你可以自动将大段文档转化为一问一答的问答对,无需人工干预。你可以对脚本文件再进行调试和改进,以适应你自己的项目。这个方法可以在处理大量文本时非常有用,特别是使用 GPT-3.5-16k 模型,它具有更大的输入长度限制,但是大文档仍然需要先做一些分段处理。

文章图片
#自动化#gpt-3#数据库
FunASR语音识别框架流式识别模型切换

本文对比了流式与非流式语音识别模型的配置差异。非流式组合(含VAD和标点)适合离线音频转写,而流式组合(基础ASR+实时标点)专为低延迟场景设计。关键区别在于:非流式ASR集成VAD/标点模块,处理完整音频;流式标点针对中文实时优化但精度可能降低。部署时需注意流式处理需分块逻辑,且标点模型需与ASR语言匹配。离线场景推荐非流式方案,实时场景应选择流式组合。

#语音识别#人工智能
YOLOv10模型训练深度解析:优化策略与实践心得

在计算机视觉领域,YOLO (You Only Look Once) 系列一直是目标检测的标杆。随着YOLOv10的发布,我们迎来了更强大、更灵活的检测模型。本文将深入探讨YOLOv10的训练过程,分享一些优化策略和实践心得。YOLOv10的训练是一个复杂而有趣的过程。通过精心的数据准备、超参数调优和训练策略优化,我们可以充分发挥这个强大模型的潜力。当然其也有定位,就是适合做图像物体检测任务,而对

文章图片
#目标跟踪#人工智能
    共 51 条
  • 1
  • 2
  • 3
  • 6
  • 请选择