logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

实测SGLang-v0.5.6多轮对话:响应快3倍,新手也能轻松搭建

本文介绍了如何在星图GPU平台上自动化部署SGLang-v0.5.6镜像,实现高效的多轮对话功能。该镜像通过RadixAttention优化和结构化输出增强,显著提升响应速度并降低显存占用,特别适用于智能客服、数据分析助手等场景,帮助用户快速搭建高性能对话系统。

为Hermes Agent框架配置Taotoken作为自定义模型供应商

对于使用Hermes Agent框架的开发团队而言,能够灵活接入不同的模型供应商是构建多样化智能应用的关键。当团队希望利用Taotoken平台聚合的丰富模型资源时,可以通过配置Hermes Agent的自定义供应商(custom provider)功能来实现。本文将详细介绍如何依据Taotoken的官方文档,在Hermes Agent中完成配置,实现与平台的无缝对接。

Python 开发者快速接入 TaoToken 实现 OpenAI 兼容调用的三步指南

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

告别 Claude Code 封号烦恼,无缝切换至 Taotoken 获取稳定服务

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

RWK35xx语音识别误唤醒抑制算法优化

本文深入解析瑞芯微RWK35xx平台的语音误唤醒问题,提出多级判别、动态阈值、上下文防抖等优化方案,结合代码实现与真实案例,有效降低误唤醒率70%以上,同时保障真唤醒率稳定。

FSMN VAD与ASR pipeline集成:端到端语音识别架构

本文介绍了如何利用星图GPU平台自动化部署FSMN VAD阿里开源的语音活动检测模型(构建by科哥),并将其与语音识别(ASR)系统集成,构建端到端的语音识别架构。该方案能有效识别音频中的语音片段,过滤噪音与静音,其典型应用场景是自动化处理会议录音,实现高效的语音转文字,提升内容处理效率。

#语音识别
Qwen3-8B + Whisper 实现端到端语音交互系统

本文介绍如何使用Qwen3-8B和Whisper构建本地化、低成本的端到端语音交互系统,实现语音识别、语义理解与响应生成的全流程离线运行,适用于隐私敏感场景与边缘设备部署。

Paraformer-large语音识别入门必看:一键部署Gradio界面详细步骤

本文介绍了如何在星图GPU平台上一键自动化部署Paraformer-large语音识别离线版 (带Gradio可视化界面)镜像,快速搭建私有化语音转文字工作站。该方案基于阿里达摩院的高精度模型,可轻松应用于会议录音转写、视频字幕生成等长音频离线转录场景,实现高效、安全的本地化处理。

#语音识别
Qwen3-ASR-1.7B vs 商业API:私有化语音识别方案对比评测

本文介绍了在星图GPU平台上自动化部署Qwen3-ASR-1.7B语音识别模型v2的方案。该私有化部署方案能有效保障数据安全,适用于企业内部会议录音转写等场景,为用户提供了一个高性价比、可控的离线语音识别选择。

#语音识别
OpenClaw自动化测试实践:ollama-QwQ-32B驱动浏览器操作与结果校验

本文介绍了如何在星图GPU平台上自动化部署【ollama】QwQ-32B镜像,实现基于自然语言的UI自动化测试。通过OpenClaw框架,该模型可将测试用例描述智能转化为浏览器操作指令,典型应用于电商网站的购物车功能验证等场景,显著提升测试效率与灵活性。

    共 341 条
  • 1
  • 2
  • 3
  • 35
  • 请选择