logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

解决Claude Code频繁封号与Token不足的稳定替代方案

你需要修改其配置文件。通常,配置文件位于。

百度语音识别API集成实践指南

语音识别技术是人工智能领域的一个重要分支,它通过计算机自动识别和理解人类语音的内容,并将其转换为可读或可理解的文本信息。从最初的受限词汇识别,发展到现在的无限制连续语音识别,技术不断进步,并在教育、医疗、客服等领域广泛应用。语音识别技术的发展可以追溯到1950年代,早期的研究主要集中在规则和模板匹配技术上。随着时间的推移,基于统计的HMM(隐马尔科夫模型)和深度学习技术的崛起,推动了语音识别准确率

小白必看:Qwen3-ASR-1.7B语音识别Web界面操作全攻略

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-1.7B语音识别镜像,快速启用开箱即用的Web界面语音转文字服务。用户上传会议录音、采访音频等文件后,几秒内即可获得带时间戳的高精度文字稿,广泛应用于会议纪要整理、方言采访转写及短视频字幕生成等场景。

#语音识别
Qwen3-ASR-0.6B模型微调指南:定制专属语音识别模型

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-0.6B镜像,实现高效的语音识别模型微调。该平台简化了环境配置流程,用户可快速构建定制化的语音转文字应用,特别适用于医疗术语识别、方言处理等专业场景,提升语音交互的准确性和效率。

#语音识别
多模态对比:Whisper-large-v3与FunASR的实时语音识别效果实测

本文介绍了在星图GPU平台上,如何自动化部署Whisper语音识别-多语言-large-v3语音识别模型(二次开发构建by113小贝),并对比其与FunASR的实时语音识别效果。该镜像可用于多语言音频文件的自动化转录场景,例如为播客、会议录音或视频内容快速生成字幕,提升内容处理效率。

#语音识别
Qwen3-1.7B语音交互系统:ASR+TTS全链路部署实例

本文介绍了如何在星图GPU平台上自动化部署Qwen3-1.7B镜像,构建端到端本地语音交互系统。该系统集成ASR语音识别与TTS语音合成,支持实时语音问答、会议纪要整理等典型场景,具备低延迟、高隐私性与强中文口语理解能力。

android11 tts,Android 11 使用 TextToSpeech 实现文字转换语音 && 相关 bug:speak failed: not bound to TTS engine...

Android 11 使用 TextToSpeech 实现文字转换语音 && 相关 bug:speak failed: not bound to TTS engine代码MainActivity.javapackagecom.example.myapplication;importandroidx.appcompat.App.AppCompatActivity;importAndr

一键体验:Qwen3-ASR-1.7B语音识别在线Demo

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-1.7B语音识别镜像,快速搭建在线语音转文字服务。用户可通过该平台轻松体验高精度语音识别,典型应用场景包括将会议录音、访谈音频等自动转写为文字纪要,极大提升内容整理效率。

#语音识别
我这个号能体验多久。为什么openai不对中国开放。

很抱歉,我无法确定您的帐号能够体验多久。这可能取决于您使用的服务和相关的服务条款。至于 OpenAI 不对中国开放的原因,这可能是由于法律和政策限制以及技术和商业原因。由于我是一个大型语言模型,我无法了解 OpenAI 的具体原因。...

从0开始学中文语音识别,用科哥镜像轻松实现会议纪要自动生成

本文介绍了如何在星图GPU平台上自动化部署Speech Seaco Paraformer ASR阿里中文语音识别模型 构建by科哥镜像,快速实现会议录音到结构化文字的转换,典型应用于自动生成高准确率中文会议纪要,显著提升办公效率。

#语音识别
    共 405 条
  • 1
  • 2
  • 3
  • 41
  • 请选择