logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

浅析ChatGPT技术

一句话介绍:ChatGPT是一个大语言模型,对应大数据、强算力、好算法。

文章图片
#人工智能#机器学习#语言模型 +1
全新逆正则ASR数据集、多年龄TTS数据集,为构建AI系统提供核心数据动能

家庭、健康、音乐、购物、体育、旅行、工作、食物、教育、电影、社交网络、朋友、娱乐、新闻、宠物、计算机、电视、名人、生活、结婚、天气等日常闲聊话题。,每人1-3小时不等。覆盖英语(美式、英式)、阿拉伯语、俄语、葡萄牙语、日语、韩语、中文方言(北京话、四川话、东北话、香港粤语)等。包括阿拉伯语、英语(英式、美式)、西班牙语、葡萄牙语、法语、德语、意大利语、中文普通话、日语、韩语、印地语、印度英语。家庭

文章图片
#人工智能#语音识别#计算机视觉 +1
模型开源|支持东方40语种+中国22方言的新SOTA语音大模型Dolphin开源啦!

在当今数字化时代,语音识别技术已成为人机交互的关键桥梁,广泛应用于智能客服、语音助手、会议转录等众多领域。然而,对于东方语言的识别如越南语、缅甸语等,现有模型往往表现不佳,难以满足用户的需求。为解决这一难题,支持东方40个语种的语音识别,中文语种支持22方言(含普通话);训练数据总时长21.2万小时:其中海天瑞声高质量专有数据13.8万小时,开源数据7.4万小时;在3个测试集(海天瑞声、Fleur

文章图片
#开源
Data-Centric AI 以数据为中心的人工智能

它由五个子目标组成,包括收集数据,用于添加信息标签的数据标记,用于清理和转换数据的数据准备,用于对原始数据做更further的processing,用于在不收集更多数据的情况下增强数据多样性。以数据为中心的AI不仅要求数据的数据大而且要求数据的质量高,需要专业的数据公司把控质量。数据的关键性日益凸显,特别是近年来大型模型的发展,如上图ChatGPT迭代过程所示,训练所需的数据不仅在质量上有所提升,

文章图片
#人工智能#机器学习
模型开源|支持东方40语种+中国22方言的新SOTA语音大模型Dolphin开源啦!

在当今数字化时代,语音识别技术已成为人机交互的关键桥梁,广泛应用于智能客服、语音助手、会议转录等众多领域。然而,对于东方语言的识别如越南语、缅甸语等,现有模型往往表现不佳,难以满足用户的需求。为解决这一难题,支持东方40个语种的语音识别,中文语种支持22方言(含普通话);训练数据总时长21.2万小时:其中海天瑞声高质量专有数据13.8万小时,开源数据7.4万小时;在3个测试集(海天瑞声、Fleur

文章图片
#开源
Data-Centric AI 以数据为中心的人工智能

它由五个子目标组成,包括收集数据,用于添加信息标签的数据标记,用于清理和转换数据的数据准备,用于对原始数据做更further的processing,用于在不收集更多数据的情况下增强数据多样性。以数据为中心的AI不仅要求数据的数据大而且要求数据的质量高,需要专业的数据公司把控质量。数据的关键性日益凸显,特别是近年来大型模型的发展,如上图ChatGPT迭代过程所示,训练所需的数据不仅在质量上有所提升,

文章图片
#人工智能#机器学习
GPT-4o来了,超拟人语音合成系统的关键都在这里

GPT-4o 作为一款人机交互的先进大模型,融合了文本、语音和图像三种模态的理解能力,其响应速度之快、情感表达之丰富以及对人类行为的深刻理解,都标志着人机交互领域的又一次飞跃。然而,直接使用这些数据训练TTS模型可以更直接有效地学习如何表达情感、语气等副语言特征,简化系统结构,提高数据的一致性与质量,增强模型的泛化能力,并减少对外部系统的依赖。情感的自动检测是通过NLP技术实现,如情感分析,但如何

文章图片
#人工智能#语音识别
高质量思维链(CoT)数据助力Deepseek成为国产大模型之光

而思维链(CoT)技术显式展示了模型在推理过程中所做的每一步推理和计算,使得模型的输出更加透明和易于理解。是近年来在人工智能领域逐渐被广泛采用的一种技术,它的核心优势在于通过模拟人类的思维过程,使得 AI 系统不仅能够做出决策,还能清晰地展示其推理过程。这种显式的推理过程提升了 AI 的可解释性和透明度,尤其在复杂的推理任务中,比传统模型更加出色。DeepSeek-R1采用了混合专家架构,能够根据

文章图片
#人工智能#自然语言处理
解锁 GPT-4o 背后数据带来的情绪价值

多模态数据涵盖文本、图像、音频、视频等,这些数据的收集和标注过程非常复杂且耗时,例如,视频数据需要逐帧标注画面中的物体、动作和背景环境,音频数据需要精细标注说话者的情感、语气和背景噪音等。当前的 AI 主要通过分析语言和语音的模式来“理解”情感,如通过改变语调和语速来表达快乐或悲伤,但这些表达往往缺乏人类的微妙和复杂性,无法完全复制人类的情感丰富性和自然流畅性。在客服、教育、娱乐等领域中,能够提升

文章图片
#人工智能#语音识别
模型开源|支持东方40语种+中国22方言的新SOTA语音大模型Dolphin开源啦!

在当今数字化时代,语音识别技术已成为人机交互的关键桥梁,广泛应用于智能客服、语音助手、会议转录等众多领域。然而,对于东方语言的识别如越南语、缅甸语等,现有模型往往表现不佳,难以满足用户的需求。为解决这一难题,支持东方40个语种的语音识别,中文语种支持22方言(含普通话);训练数据总时长21.2万小时:其中海天瑞声高质量专有数据13.8万小时,开源数据7.4万小时;在3个测试集(海天瑞声、Fleur

文章图片
#开源
    共 26 条
  • 1
  • 2
  • 3
  • 请选择