logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

快手 Kling APP 登陆美区 App Store,安卓版即将推出

简单体验了一下,和 Web 版本差不多,支持 kolors 1.5 生成图片和 kling 1.6 生成图生视频、文生视频。现已正式上架美区 App Store,安卓版本也即将上线。

文章图片
#人工智能
高品质白菜价 1080p 视频生成模型

海螺 AI 在其 MiniMaxWeek 的第二天推出了 Hailuo 02 视频模型[3],官方号称一流品质,白菜价格支持原生 1080p输出,可以生成杂技表演等复杂动作。海螺 AI 发布的 Minimax Agent[1] 是一款类似 Manus 的产品,他们还开源了其核心的 Minimax M1 推理模型[2]。同时还推出了 Gemini 2.5 Flash-Lite 预览版,这是目前谷歌速

文章图片
#人工智能#开源
2025 年 TOP9 大模型 Elo 得分趋势:xAI 领跑

在过去的几个月中,AI 大模型的竞争依然非常卷。继上个月 DeepSeek 的几次技术突破后,xAI 凭借其最新的 Grok3 Beta 版一跃登上排行榜首位,成为当前大模型赛道的领跑者。提供了 2025 年 TOP9 来自 Chatbot Arena 的 Elo 得分趋势的可视化数据。你可以通过视频看到这些趋势,如果你懒得看视频,也可以查看这个。

文章图片
#人工智能
阿里 Qwen-Image:20B 参数开源文生图模型,文本渲染能力突出

该模型是一个拥有 20B 参数的 MMDiT 模型,基于 Apache 2.0 许可证开源。该功能支持文生图,生成速度极快,就跟刷小红书似的。还支持图生视频,不过效果一般,但生成效率同样出色,最 6 的是原生支持 NSFW 内容生成。这些模型专门针对消费级 GPU、边缘计算设备(包括智能汽车、智能家居)以及移动终端(手机和 PC)等低功耗场景优化设计。腾讯混元团队[2]一次性开源了四款参数规模从

文章图片
#人工智能#开源
ZyphraAI 发布 Zonos-TTS:开源可商用多语言 TTS 模型

该模型经过 20 万小时的英语语音数据训练,表现出色。除了支持本地部署外,ZyphraAI 还提供了便捷的 API 服务,用户每月可免费生成 100 分钟的音频,专业版则提供 300 分钟/5 美元的服务,超出部分按每分钟 0.02 美元计费。是 ZyphraAI 最新发布的多语言 TTS 模型,基于 Apache 2.0 许可证,完全可商用,并支持即时语音克隆功能。值得注意的是,其中的语音克隆功

文章图片
#人工智能
Head AI:全球首个 AI 市场营销专家

Head AI[1] 是全球首位人工智能营销专家,其官网号称在过去一个月内已为超过 50,000 个品牌提供服务,覆盖电商、科技、游戏和 AI 等多个领域,业务范围触及全球 200 多个国家和地区。通过 24/7 不间断学习和优化,已帮助客户创造了超过 1 亿美元的收入,并将投资回报率(ROI)提升了惊人的 25 倍。字节跳动开源的 BAGEL[2] 是一个统一多模态模型,采用原生多模态架构,功能

文章图片
#人工智能#开源#AI作画
MetaGPT X:首个 AI 开发团队发布,替代小型开发团队

这是一个多智能体开发团队,由 leader、product manager、architect、engineer 和 data analyst 共 5 位 AI 智能体组成,能够创建网站、博客、商店、分析、游戏等,目标是替代小型开发团队。,METAGPT v1.0 将在晚些时候开源。多智能体开发团队现已发布。现在可以在官网免费试用。

文章图片
#人工智能#游戏#团队开发
英伟达开源 Cosmos 世界模型:助力机器人与自动驾驶数据生成

这模型支持文生视频和文+视频生视频,主要应用于机器人和自动驾驶领域的大规模合成数据生成。目前,英伟达已经开放了多个不同的预训练模型,这些模型均支持商业用途。,看看这个模型的实际效果如何。

文章图片
#机器人#自动驾驶#人工智能
看来小红书这次是认真在搞大模型了,开源 dots.llm1 MoE 大模型

Eleven Labs 官方[1] 宣布推出 Eleven v3(alpha 版本),这个语音模型支持 70 多种语言,具备多说话人对话功能,还能通过情感音频标签实现更自然的语音表达。dots.llm1[4] 是小红书开源的最新 MoE 大语言模型,总参数达 143B ,激活参数 14B ,提供 base 和 inst 两个版本。从官方公布的 MMLU-Pro 评分来看,表现相当不错 - 虽然比不

文章图片
#人工智能#AI作画#开源
xAI AI 伴侣 Ani 和 Valentine 支持电话实时通话

OpenAI最新推出了从入门到生产级的 AI 应用开发学习路径[3],学习后能够掌握AI基础概念,将其融入 AI 应用开发中,评估应用性能,并实施最佳实践以确保AI解决方案稳健且可大规模部署。现在,你可以像给朋友打电话一样,直接拨打 +1 (325) 225-5264(Ani)或 +1 (607) 225-5825(Valentine),与你的 AI 伴侣进行自然流畅的语音交流。该模型推理速度相比

文章图片
#人工智能
    共 191 条
  • 1
  • 2
  • 3
  • 20
  • 请选择