logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

为Claude Code配置Taotoken解决访问不稳定与Token不足难题

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

Taotoken多模型聚合平台助力智能客服场景降本增效

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

超级千问语音设计世界:小白也能做的游戏配音教程

本文介绍了如何在星图GPU平台上一键自动化部署🍄超级千问:语音设计世界(Super Qwen Voice World)镜像,实现游戏角色配音的快速生成。该工具基于Qwen3-TTS技术,通过游戏化界面让用户轻松输入台词并生成专业级语音,特别适用于独立游戏开发、视频配音等场景,大幅降低语音制作门槛和成本。

#游戏开发#AI配音
Qwen3-VL-WEBUI应用场景:智能客服图文问答系统搭建

Qwen3-VL-WEBUI 凭借其强大的多模态理解能力和便捷的部署方式,为智能客服系统的升级提供了切实可行的技术路径。✅降低人工成本:减少 40% 以上需转人工的图文咨询✅提升响应质量:从“关键词匹配”迈向“语义+视觉”双重理解✅增强用户体验:支持自然的图文混合交互,提升满意度未来,随着 Qwen 系列持续迭代,特别是 MoE 架构和 Thinking 模式的深入应用,智能客服将逐步向“自主决策

STM32F103 TVS瞬态抑制保护语音识别玻璃破碎电路

本文详解基于STM32F103的玻璃破碎检测系统,涵盖TVS瞬态保护设计、音频信号采集优化及轻量级识别算法实现,结合电路与代码,提升智能安防设备的可靠性和抗干扰能力。

实时语音转文字来了!用Paraformer做即时记录太方便了

本文介绍了基于星图GPU平台自动化部署“Speech Seaco Paraformer ASR阿里中文语音识别模型 构建by科哥”镜像的完整方案。该平台支持一键启动WebUI服务,实现高效中文语音转文字,适用于会议记录、访谈整理等实时录音识别场景,显著提升AI应用开发与模型微调效率。

FunASR语音识别参数详解:语言模型融合技术解析

本文介绍了基于星图GPU平台自动化部署FunASR语音识别基于speech_ngram_lm_zh-cn二次开发构建by科哥镜像的方法,结合语言模型融合技术,显著提升中文语音识别准确率。该镜像适用于模型微调、AI应用开发等场景,支持在WebUI中灵活配置参数,实现高效精准的语音转写与语义理解,助力开发者快速构建专业级语音处理系统。

Qwen3-ForcedAligner-0.6B:本地化语音识别解决方案

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ForcedAligner-0.6B镜像,实现本地化高精度语音识别。该镜像支持字级别毫秒级时间戳对齐,典型应用于视频字幕制作、会议纪要生成及教育类播客的精准转录,全程离线运行,保障语音数据隐私安全。

#语音识别
不用联网也能用!Fun-ASR本地离线语音识别体验

本文介绍了基于星图GPU平台自动化部署Fun-ASR钉钉联合通义推出的语音识别大模型语音识别系统 构建by科哥镜像的实践方法,实现无需联网的本地化语音转文字功能。该系统支持会议记录、课堂听讲等场景下的离线语音识别,兼顾隐私安全与高效处理,适用于AI应用开发与模型微调需求。

搭建自己的语音识别服务:Fun-ASR + GPU算力平台完整教程

通过Fun-ASR结合GPU实现高效、安全的本地语音转写,支持中文识别、热词增强与文本规整,适合企业级私有化部署,兼顾性能与隐私保护。

    共 394 条
  • 1
  • 2
  • 3
  • 40
  • 请选择