logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Ti-Audio:一个端到端藏语语音语言大模型

而该藏语语音语言大模型与现有国内外领先大模型Gemini 3 Flash、deepseek V3.1、Hunyun-MT-7B、Monlam(莫兰)进行了测试评估,该大模型在语音翻译任务(Speech-to-Text, ST)、语音识别(Automatic Speech Recognition, ASR)等任务上的表现超越了其它模型, 在性别识别(Gender Recognition, GR)、说

文章图片
#论文阅读
Ti-Audio:一个端到端藏语语音语言大模型

而该藏语语音语言大模型与现有国内外领先大模型Gemini 3 Flash、deepseek V3.1、Hunyun-MT-7B、Monlam(莫兰)进行了测试评估,该大模型在语音翻译任务(Speech-to-Text, ST)、语音识别(Automatic Speech Recognition, ASR)等任务上的表现超越了其它模型, 在性别识别(Gender Recognition, GR)、说

文章图片
#论文阅读
Ti-Audio:一个端到端藏语语音语言大模型

而该藏语语音语言大模型与现有国内外领先大模型Gemini 3 Flash、deepseek V3.1、Hunyun-MT-7B、Monlam(莫兰)进行了测试评估,该大模型在语音翻译任务(Speech-to-Text, ST)、语音识别(Automatic Speech Recognition, ASR)等任务上的表现超越了其它模型, 在性别识别(Gender Recognition, GR)、说

文章图片
#论文阅读
到底了