logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Taotoken助力Claude Code用户解决封号与Token不足难题

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

在Hermes Agent项目中配置Taotoken作为自定义模型供应商

对于使用Hermes Agent框架构建AI应用的开发者而言,灵活接入不同的大模型服务是核心需求之一。Taotoken平台提供了OpenAI兼容的API,可以作为一个统一的自定义供应商集成到Hermes Agent项目中。本文将逐步演示如何完成这一配置,确保你的应用能够通过Taotoken调用平台上的多种模型。

多人语音交互会议的HiChatBox办公协作系统

HiChatBox是一款具备空间感知能力的智能办公协作终端,通过多麦克风阵列、波束成形、AEC/NS/AGC音频处理及WebRTC传输技术,解决传统会议中的回声、噪音与语音混淆问题,实现清晰、低延迟、隐私安全的多人语音交互体验。

小智AI音箱语音识别关键词自定义模型迁移

小智AI音箱通过关键词检测与迁移学习,实现低功耗、高精度的自定义语音唤醒,支持个性化指令识别与边缘部署优化。

#语音识别
Qwen3-ASR-1.7B在智能客服中的情绪识别应用

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-1.7B大模型驱动的语音识别镜像,赋能智能客服系统实现高精度情绪识别。该镜像可实时分析用户语速、音调、停顿等语音特征,在客服通话中精准识别焦虑、愤怒等情绪状态,显著提升客户满意度与一次解决率。

#语音识别
VibeVoice与ASR系统对接:构建双向语音交互闭环的技术路径

本文介绍了在星图GPU平台上自动化部署VibeVoice实时语音合成系统镜像,以构建完整的双向语音交互应用。通过该平台,开发者可快速搭建集成了自动语音识别(ASR)与语音合成的系统,实现如智能语音助手、实时对话机器人等典型应用场景,显著提升交互体验与开发效率。

实测Fun-ASR语音识别效果,方言识别准确率超93%

本文介绍了如何在星图GPU平台上自动化部署Fun-ASR-MLT-Nano-2512语音识别模型 二次开发构建by113小贝镜像,高效实现高准确率方言语音转写。该镜像特别适用于会议录音转文字、多口音客服对话分析等真实场景,在信噪比低至5dB的嘈杂环境中仍保持93%以上识别准确率,显著提升语音处理效率与本地化适配能力。

#语音识别
5分钟部署通义千问3-14B:ollama双模式一键切换实战

本文介绍了基于星图GPU平台,如何自动化部署通义千问3-14B镜像,实现5分钟内完成本地化大模型搭建。通过Ollama与WebUI结合,支持双推理模式一键切换,适用于模型微调、AI应用开发等场景,显著降低部署门槛,提升开发效率。

Qwen3-ASR-0.6B迁移学习教程:适应特定领域的语音识别

本文介绍了如何在星图GPU平台自动化部署Qwen/Qwen3-ASR-0.6B镜像,实现特定领域的语音识别迁移学习。该镜像支持52种语言,通过微调可显著提升医疗、法律等专业场景的语音转录准确率,满足行业定制化需求。

#语音识别#迁移学习
全球电商平台:HunyuanOCR统一处理各国商家上传资质证明

腾讯推出的HunyuanOCR通过端到端多模态大模型,直接从复杂、多语言的商家资质文件中提取结构化信息,无需模板与规则堆叠。仅用10亿参数实现高精度识别,支持上百种语言混合处理,在跨境电商场景中实现秒级自动审核,显著降低运维成本并提升全球化业务处理效率。

    共 415 条
  • 1
  • 2
  • 3
  • 42
  • 请选择