logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

通过精细化数据标注,为小语种对话模型注入角色与文化内核

》当前小语种AI对话模型普遍存在机械生硬的问题,其核心在于缺乏文化深度和角色定位。要实现突破,必须将数据标注从传统的语法识别升级为文化塑造工程。 关键转变是从"语言正确"到"文化得体",要求模型具备语境感知、价值观对齐和社会常识三大能力。这需要标注团队不仅精通语言,更要理解文化密码。 解决方案包括三维标注框架:角色设定定义虚拟人格,文化认知赋予本地常识,语境

文章图片
#人工智能
通过精细化数据标注,为小语种对话模型注入角色与文化内核

》当前小语种AI对话模型普遍存在机械生硬的问题,其核心在于缺乏文化深度和角色定位。要实现突破,必须将数据标注从传统的语法识别升级为文化塑造工程。 关键转变是从"语言正确"到"文化得体",要求模型具备语境感知、价值观对齐和社会常识三大能力。这需要标注团队不仅精通语言,更要理解文化密码。 解决方案包括三维标注框架:角色设定定义虚拟人格,文化认知赋予本地常识,语境

文章图片
#人工智能
ASR标注:让模型听懂人类的语言

摘要:ASR(自动语音识别)标注是实现语音交互的关键技术,通过将语音转化为结构化文本及标签信息,帮助AI模型理解人类语言。其标注体系包括基础转录、说话人属性、语义标签等维度,采用"自动化预标注+人工校验"模式提升效率。该技术广泛应用于智能家居、企业办公、医疗法律等领域,为AI大模型提供高质量训练数据。曼孚科技通过技术创新构建了成熟的ASR标注服务体系,持续推动语音交互能力的突破

文章图片
ASR标注:让模型听懂人类的语言

摘要:ASR(自动语音识别)标注是实现语音交互的关键技术,通过将语音转化为结构化文本及标签信息,帮助AI模型理解人类语言。其标注体系包括基础转录、说话人属性、语义标签等维度,采用"自动化预标注+人工校验"模式提升效率。该技术广泛应用于智能家居、企业办公、医疗法律等领域,为AI大模型提供高质量训练数据。曼孚科技通过技术创新构建了成熟的ASR标注服务体系,持续推动语音交互能力的突破

文章图片
一文读懂生成式人工智能的所有基础知识(上)

生成式人工智能又名AIGC,是相对于PCG(专业生成内容)、UCG(用户生成内容)提出的又一概念。它善于从现有内容中学到的模式来创建新内容,包括文本、图像、音频、视频和3D交互内容等各种形式的内容和数据。中国信息通信研究院曾在《人工智能生成内容(AIGC)白皮书(2022年)》中发表观点,将AIGC的发展历程大致分为三个阶段,分别为早起萌芽阶段(1950-1990)、沉淀积累阶段(1990-201

文章图片
#人工智能
多模态大模型:开启下一代多模态应用的革命性突破

在研究进展与计算能力提升的双重驱动下,多模态大模型的发展正驶入快车道。随着模型不断进化,其变革AI应用的潜力日益凸显。未来,多模态大模型的重要发展方向之一是生成“文本-图像交织内容”——将文本描述与配套视觉元素深度融合,实现更全面的多模态内容理解与生成。此外,拓展多模态大模型的模态覆盖范围(整合更多类型的数据)将进一步增强其能力,使其能更灵活、更深入地与多媒体信息及现实世界环境交互,提升多感官领域

文章图片
#人工智能#语言模型#transformer +1
一文读懂生成式人工智能的所有基础知识(下)

在深入探讨了生成式人工智能的各种技术类型之后,不难发现,这些技术已不仅仅是理论上的概念,而是真正进入了商业应用的现实场景中。从生成对抗网络(GANs)的创新性数据生成到变分自编码器(VAEs)在图像处理中的应用,从大模型如Transformer的语言处理能力到递归神经网络(RNNs)在序列数据中的应用,再到大型语言模型(LLMs)在内容创作和自动化编程中的突破,这些技术正在逐步塑造出全新的商业生态

文章图片
#人工智能
一文读懂生成式人工智能的所有基础知识(上)

生成式人工智能又名AIGC,是相对于PCG(专业生成内容)、UCG(用户生成内容)提出的又一概念。它善于从现有内容中学到的模式来创建新内容,包括文本、图像、音频、视频和3D交互内容等各种形式的内容和数据。中国信息通信研究院曾在《人工智能生成内容(AIGC)白皮书(2022年)》中发表观点,将AIGC的发展历程大致分为三个阶段,分别为早起萌芽阶段(1950-1990)、沉淀积累阶段(1990-201

文章图片
#人工智能
多模态大模型:开启下一代多模态应用的革命性突破

在研究进展与计算能力提升的双重驱动下,多模态大模型的发展正驶入快车道。随着模型不断进化,其变革AI应用的潜力日益凸显。未来,多模态大模型的重要发展方向之一是生成“文本-图像交织内容”——将文本描述与配套视觉元素深度融合,实现更全面的多模态内容理解与生成。此外,拓展多模态大模型的模态覆盖范围(整合更多类型的数据)将进一步增强其能力,使其能更灵活、更深入地与多媒体信息及现实世界环境交互,提升多感官领域

文章图片
#人工智能#语言模型#transformer +1
一文剖析丨为什么大模型会说胡话?

大语言模型“幻觉”问题的根源与应对策略 大语言模型常表现出“时而天才,时而荒诞”的矛盾输出,这种“表面流畅但事实错误”的现象被称为“幻觉”。其根源包括:训练数据中的噪声与偏见、基于统计而非事实的文本预测机制、为取悦用户而编造的倾向、缺乏现实体验的符号处理、对错误前提的盲从,以及模型架构固有的创造性缺陷。 为减少幻觉,业界采用四大策略:检索增强生成(RAG)连接权威知识库确保事实依据;提示词工程通过

文章图片
#人工智能#语言模型#transformer +1
    共 24 条
  • 1
  • 2
  • 3
  • 请选择