logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

HappyHorse力压Seedance2.0登顶,幕后团队曝光:疑似阿里P11张迪领衔

阿里旗下HappyHorse模型在全球权威AI视频榜单Artificial Analysis上登顶,以1355分大幅领先第二名字节跳动82分。该模型由"可灵之父"张迪团队5个月打造,展现了阿里从基础设施到模型层的全栈AI实力。HappyHorse的胜出打破了国内AI视频格局,证明技术壁垒尚未固化,人才流动和全栈布局正重塑行业竞争。评测体系的成熟也使AI竞争更透明,推动行业从营销

文章图片
#开发语言#AIGC
小米OmniVoice开源600+语种TTS模型,中文准确率吊打ElevenLabs?

小米开源OmniVoice语音合成模型实现技术突破,支持600多种语言并达到SOTA水平。该模型采用创新架构,合成速度达实时40倍,中文识别准确率WER仅0.84%,超越主流商用产品。其零样本克隆功能仅需3秒音频即可复制声音,并支持个性化调整。特别值得一提的是,该技术为小语种数字化保护提供可能。项目完全开源,将大幅降低语音合成技术门槛,推动有声书、虚拟主播等应用发展。

文章图片
#AIGC#人工智能
小米OmniVoice开源600+语种TTS模型,中文准确率吊打ElevenLabs?

小米开源OmniVoice语音合成模型实现技术突破,支持600多种语言并达到SOTA水平。该模型采用创新架构,合成速度达实时40倍,中文识别准确率WER仅0.84%,超越主流商用产品。其零样本克隆功能仅需3秒音频即可复制声音,并支持个性化调整。特别值得一提的是,该技术为小语种数字化保护提供可能。项目完全开源,将大幅降低语音合成技术门槛,推动有声书、虚拟主播等应用发展。

文章图片
#AIGC#人工智能
Anthropic史诗级泄露,Claude Code CLI 51万行源码直接裸奔

2026年3月31日,Anthropic公司遭遇重大技术事故,其AI编程助手ClaudeCode的51.2万行完整源码意外泄露。事故源于技术人员在发布v2.1.88版本时,忘记删除59.8MB的Sourcemap调试文件,导致核心代码完全暴露。泄露内容不仅包含现有功能源码,还包括44个未发布功能(如24/7后台Agent、多AI协同等)、系统提示词和工程师隐藏的趣味彩蛋。虽然不影响用户数据安全,但

文章图片
#AIGC#人工智能
微软开源语音模型VibeVoice火了:GitHub一天27K Star,能处理90分钟长音频

微软开源VibeVoice语音AI模型家族,包含ASR和TTS三大核心模型,支持50多种语言、多说话人对话和实时语音生成。采用MIT协议允许本地部署,解决数据安全和成本问题。项目上线即获27K Star,已有开发者基于模型开发实用工具。此次开源将大幅降低语音AI应用门槛,可能引发类似Stable Diffusion的开源效应,推动语音AI应用爆发式增长。微软通过音频水印等机制平衡技术创新与风险管控

文章图片
#microsoft#github#音视频
Cursor承认Composer 2核心基座源自国产大模型Kimi,双方已达成授权合作

本周,全球AI编程领域发生了一起极具戏剧性的“反转”事件。长期被视为硅谷AI明星初创公司的Cursor,在发布其号称拥有“巅峰级编程智慧”的新一代模型Composer 2后,迅速陷入了一场关于技术原创性的信任危机。不同于以往的技术迭代赞美,这次迎接他们的是来自开发者社区的“代码 forensic(取证)”。

文章图片
#composer#php#人工智能 +1
阿里通义实验室首个影视级多模态配音模型Fun-CineForge发布,已正式开源

通义实验室推出开源影视级配音模型Fun-CineForge,突破传统AI配音瓶颈。该模型通过四模态融合架构实现四大创新:精准口型同步、拟人化情绪表达、稳定音色一致性及复杂场景时间对齐。配套开源的CineDub高质量数据集支持模型训练,显著降低转录错误率。实验数据显示,Fun-CineForge在多项关键指标上超越基线模型,首次实现对多人对话场景的精准支持。该技术为影视制作提供高效、低成本的配音解决

文章图片
#AIGC#人工智能
OpenAI发布GPT-5.4:支持百万Token上下文与原生电脑操作

2026年3月5日,OpenAI发布革命性GPT-5.4系列模型,带来三大突破性升级:1)首创"Thinking模式"实现透明化推理过程;2)百万Token上下文窗口支持处理超长文本;3)原生电脑操作能力使AI可执行跨应用任务。专业版针对高难度场景优化,错误率较前代降低18%。该版本标志着AI从对话工具向自主智能体的转变,在编程、办公、科研等领域实现人机协作新高度。目前模型已向

文章图片
#人工智能#AIGC
匿名屠榜后官宣!智谱 GLM-5 海外首发上线,对标国际顶尖大模型

智谱AI正式发布新一代大模型GLM-5,此前匿名测试版"PonyAlpha"已在OpenRouter平台引发轰动。这款744B参数的模型采用DSA稀疏注意力架构,在编程和智能体任务上达到开源SOTA水平,实测对标ClaudeOpus4.5。GLM-5率先海外上线并提价30%-100%,同时开源MIT协议版本,支持多语言和主流开发工具。作为国产大模型出海里程碑,GLM-5展现了在

文章图片
#人工智能#AIGC
通义实验室发布:Fun-CosyVoice3.5与Fun-AudioGen-VD语音双模型

阿里通义实验室发布两款革命性语音生成模型Fun-CosyVoice3.5和Fun-AudioGen-VD,支持"FreeStyle"自然语言指令控制。Fun-CosyVoice3.5实现多语种复刻与精细控制,新增4种语言支持,生僻字错误率降低10%,延迟减少35%。Fun-AudioGen-VD提供全场景声音设计,支持音色定制、情绪模拟和环境特效。两款模型大幅降低语音创作门槛,

文章图片
#AIGC#人工智能
    共 61 条
  • 1
  • 2
  • 3
  • 7
  • 请选择