logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【AI大模型前沿】腾讯 Youtu-LLM:轻量级语言模型的高性能突破

Youtu-LLM 是腾讯 Youtu 团队开源的轻量级语言模型,参数规模为 19.6 亿。它专为智能体任务设计,具备强大的“原生智能体能力”,在多项任务中超越同规模甚至更大模型。模型采用紧凑架构和 128K 长上下文窗口,支持长程任务处理,并针对 STEM 领域优化词表,提升推理效率。

文章图片
#人工智能#语言模型#自然语言处理 +3
【AI大模型前沿】星辰语义大模型TeleChat3:国产千亿MoE大模型的创新与应用

TeleChat3是中国电信人工智能研究院自主研发的千亿参数细粒度MoE语义大模型,完全基于国产算力训练,支持多轮对话、文本创作、代码生成等任务。该系列模型包括TeleChat3-105B-A4.7B-Thinking和TeleChat3-36B-Thinking,均引入了“思考模式”,在知识问答、数学推理、代码生成等六大核心维度性能比肩国际主流头部模型。

文章图片
#人工智能#开源#AIGC +2
【AI大模型前沿】Fun-Audio-Chat:阿里巴巴开源的高效语音交互大模型

Fun-Audio-Chat 是一款专注于自然、低延迟语音交互的大型音频语言模型。它通过引入双分辨率语音表征(5Hz 的高效共享主干 + 25Hz 的精细头部)大幅降低计算成本,同时保持高质量语音输出,并采用 Core-Cocktail 训练策略保留强大的文本语言模型能力。该模型在口语问答、音频理解、语音功能调用、语音指令跟随和语音共情等多个基准测试中均取得了顶尖成绩。

文章图片
#人工智能#开源#AIGC +2
【AI大模型前沿】XVERSE-Ent:元象开源的泛娱乐中英双语底座大模型

XVERSE-Ent是元象科技开源的专为泛娱乐领域设计的中英双语底座大模型,包含中文模型XVERSE-Ent-A4.2B和英文模型XVERSE-Ent-A5.7B。该模型在角色一致性、长剧情理解和多元语境适配上表现出色,能够长期保持虚拟角色的人设和风格,精准把握复杂故事线,并根据不同题材提供风格化表达。

文章图片
#人工智能#开源#AIGC +2
【GitHub开源AI精选】MemOS:解锁AI记忆潜能,打造记忆原生的智能系统

MemOS是一个开源的AI记忆管理操作系统,旨在为智能体和AI应用提供长期记忆能力。它通过统一的记忆抽象层,支持多种记忆类型(如文本记忆、激活记忆、参数记忆),具备动态知识图谱、记忆调度和生命周期管理等功能。MemOS能够使AI系统像人类一样记住用户过往信息,并在后续交互中主动调用记忆,从而实现更连贯、个性化的对话体验。

文章图片
#开源#人工智能#AIGC +1
【GitHub开源AI精选】AutoMV:开源多智能体音乐视频生成系统,开启AI创作新时代

AutoMV是一个无需训练的多智能体系统,能够直接从完整歌曲生成连贯的音乐视频。它通过音乐信息检索提取歌曲的关键特征,如节拍、结构和歌词时间戳,然后由编剧和导演智能体协作生成剧本和拍摄计划,最终通过生成模块和验证模块完成视频制作并确保质量。这一创新的系统不仅实现了从音频和歌词到完整音乐视频的端到端生成,还具备高效、低成本和高质量的特点。

文章图片
#开源#人工智能#AIGC +1
【AI大模型前沿】DeepSeek-Math-V2:数学推理的智能助手,从定理证明到竞赛夺冠

DeepSeek-Math-V2 是一个专注于数学推理的开源大语言模型,由 DeepSeek 团队开发。它基于 DeepSeek-V3.2-Exp-Base 构建,采用验证器 - 生成器协同进化的训练方式,通过自我验证机制显著提升了数学定理证明和推理的严谨性。该模型在国际数学奥林匹克竞赛(IMO)、中国数学奥林匹克竞赛(CMO)和普特南数学竞赛(Putnam)等权威基准测试中表现出色,接近满分水平

文章图片
#人工智能#AIGC#开源 +1
【AI大模型前沿】Olmo 3:开源时代的 AI 定制先锋,打造专属智能模型

Olmo 3是一系列开源大型语言模型,由AI2开发,旨在通过提供完整的模型开发流程,推动AI的可解释性、协作创新和负责任的发展。该系列模型包括多个版本,如Olmo 3-Base(基础模型,7B和32B参数)、Olmo 3-Think(推理模型)、Olmo 3-Instruct(对话模型)以及Olmo 3-RL Zero(强化学习路径)。Olmo 3-Base在编程、阅读理解和数学解题等方面表现出色

文章图片
#人工智能#开源#AIGC +2
AI大模型前沿】GLM-TTS:智谱AI打造的可控情感零样本文本转语音模型

GLM-TTS 是智谱 AI 开发的零样本语音合成系统,基于大型语言模型,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合 LLM 生成语音 Token 和 Flow Matching 模型合成波形。通过引入多奖励强化学习框架,GLM-TTS 在情感表达和语音自然度上显著优于传统 TTS 系统。

文章图片
#人工智能#开源#AIGC +2
探索AIGC的无限可能:引领人工智能生成内容的未来

在数字化浪潮的推动下,人工智能技术正以前所未有的速度重塑我们的生活和工作方式。AIGC(人工智能生成内容)作为人工智能领域的一颗璀璨新星,正在以其独特的魅力吸引着全球的关注。AIGC涉及利用人工智能算法自动或半自动地生成具有创意的内容,包括文字、图像、音频甚至视频。从专业角度来看,AIGC结合了机器学习、大数据分析、自然语言处理等技术,通过模仿人类的创作过程,实现对内容的自动生成和编辑。

文章图片
#AIGC#人工智能#程序人生
    共 75 条
  • 1
  • 2
  • 3
  • 8
  • 请选择