沉默的大羚羊个人主页

@weixin_42376614

沉默的大羚羊

2023-08-18 11:59:06 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

实测SGLang-v0.5.6多轮对话：响应快3倍，新手也能轻松搭建

本文介绍了如何在星图GPU平台上自动化部署SGLang-v0.5.6镜像，实现高效的多轮对话功能。该镜像通过RadixAttention优化和结构化输出增强，显著提升响应速度并降低显存占用，特别适用于智能客服、数据分析助手等场景，帮助用户快速搭建高性能对话系统。

为Hermes Agent框架配置Taotoken作为自定义模型供应商

对于使用Hermes Agent框架的开发团队而言，能够灵活接入不同的模型供应商是构建多样化智能应用的关键。当团队希望利用Taotoken平台聚合的丰富模型资源时，可以通过配置Hermes Agent的自定义供应商（custom provider）功能来实现。本文将详细介绍如何依据Taotoken的官方文档，在Hermes Agent中完成配置，实现与平台的无缝对接。

Python 开发者快速接入 TaoToken 实现 OpenAI 兼容调用的三步指南

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。👉。

告别 Claude Code 封号烦恼，无缝切换至 Taotoken 获取稳定服务

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。👉。

RWK35xx语音识别误唤醒抑制算法优化

本文深入解析瑞芯微RWK35xx平台的语音误唤醒问题，提出多级判别、动态阈值、上下文防抖等优化方案，结合代码实现与真实案例，有效降低误唤醒率70%以上，同时保障真唤醒率稳定。

FSMN VAD与ASR pipeline集成：端到端语音识别架构

本文介绍了如何利用星图GPU平台自动化部署FSMN VAD阿里开源的语音活动检测模型（构建by科哥），并将其与语音识别（ASR）系统集成，构建端到端的语音识别架构。该方案能有效识别音频中的语音片段，过滤噪音与静音，其典型应用场景是自动化处理会议录音，实现高效的语音转文字，提升内容处理效率。

#语音识别

Qwen3-8B + Whisper 实现端到端语音交互系统

本文介绍如何使用Qwen3-8B和Whisper构建本地化、低成本的端到端语音交互系统，实现语音识别、语义理解与响应生成的全流程离线运行，适用于隐私敏感场景与边缘设备部署。

Paraformer-large语音识别入门必看：一键部署Gradio界面详细步骤

本文介绍了如何在星图GPU平台上一键自动化部署Paraformer-large语音识别离线版 (带Gradio可视化界面)镜像，快速搭建私有化语音转文字工作站。该方案基于阿里达摩院的高精度模型，可轻松应用于会议录音转写、视频字幕生成等长音频离线转录场景，实现高效、安全的本地化处理。

#语音识别

Qwen3-ASR-1.7B vs 商业API：私有化语音识别方案对比评测

本文介绍了在星图GPU平台上自动化部署Qwen3-ASR-1.7B语音识别模型v2的方案。该私有化部署方案能有效保障数据安全，适用于企业内部会议录音转写等场景，为用户提供了一个高性价比、可控的离线语音识别选择。

#语音识别

OpenClaw自动化测试实践：ollama-QwQ-32B驱动浏览器操作与结果校验

本文介绍了如何在星图GPU平台上自动化部署【ollama】QwQ-32B镜像，实现基于自然语言的UI自动化测试。通过OpenClaw框架，该模型可将测试用例描述智能转化为浏览器操作指令，典型应用于电商网站的购物车功能验证等场景，显著提升测试效率与灵活性。

共 341 条

请选择