logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

豆包推出可视化AI编程,让你通过拖拽就能快速开发网页应用,告别代码壁垒

豆包AI助手推出"应用创造1.0"功能,带来可视化编程新体验。该功能支持用户像编辑PPT一样直观地修改网页应用内容,包括文字、图片及局部元素调整,大幅降低编程门槛,让零基础用户也能轻松上手。这是豆包继1月份推出专业编程功能后,在普及AI编程工具上的又一重要升级,旨在让更多人享受AI辅助开发的便利。用户可通过豆包首页的"AI编程"入口体验这一新功能。

文章图片
#AIGC#人工智能
腾讯开源机器人“最强大脑“:HY-Embodied-0.5-X发布,刷新22项评测16项最佳

腾讯开源专为机器人设计的HY-Embodied-0.5-X多模态大模型,采用创新的MoT架构,在22项评测中获得16项最佳。该模型包含2B端侧版和32B复杂推理版,具备空间感知、动作规划和风险预判能力,基于超1亿条专属数据训练。其核心优势在于实时视觉处理和高精度动作执行,使机器人能更好地适应真实场景。目前模型已在GitHub和HuggingFace开源,可应用于家庭服务和工业生产线等领域,推动具身

文章图片
#机器人
腾讯开源机器人“最强大脑“:HY-Embodied-0.5-X发布,刷新22项评测16项最佳

腾讯开源专为机器人设计的HY-Embodied-0.5-X多模态大模型,采用创新的MoT架构,在22项评测中获得16项最佳。该模型包含2B端侧版和32B复杂推理版,具备空间感知、动作规划和风险预判能力,基于超1亿条专属数据训练。其核心优势在于实时视觉处理和高精度动作执行,使机器人能更好地适应真实场景。目前模型已在GitHub和HuggingFace开源,可应用于家庭服务和工业生产线等领域,推动具身

文章图片
#机器人
腾讯开源机器人“最强大脑“:HY-Embodied-0.5-X发布,刷新22项评测16项最佳

腾讯开源专为机器人设计的HY-Embodied-0.5-X多模态大模型,采用创新的MoT架构,在22项评测中获得16项最佳。该模型包含2B端侧版和32B复杂推理版,具备空间感知、动作规划和风险预判能力,基于超1亿条专属数据训练。其核心优势在于实时视觉处理和高精度动作执行,使机器人能更好地适应真实场景。目前模型已在GitHub和HuggingFace开源,可应用于家庭服务和工业生产线等领域,推动具身

文章图片
#机器人
腾讯开源机器人“最强大脑“:HY-Embodied-0.5-X发布,刷新22项评测16项最佳

腾讯开源专为机器人设计的HY-Embodied-0.5-X多模态大模型,采用创新的MoT架构,在22项评测中获得16项最佳。该模型包含2B端侧版和32B复杂推理版,具备空间感知、动作规划和风险预判能力,基于超1亿条专属数据训练。其核心优势在于实时视觉处理和高精度动作执行,使机器人能更好地适应真实场景。目前模型已在GitHub和HuggingFace开源,可应用于家庭服务和工业生产线等领域,推动具身

文章图片
#机器人
Skywork AI团队发布了Matrix-Game 3.0,实现720p 40帧实时生成,解决AI视频“失忆”问题

AI视频生成迎来重大突破:SkyworkAI团队发布的Matrix-Game3.0首次在720p高清分辨率下实现40帧/秒的实时视频生成,并解决了长期存在的"失忆"问题。通过相机感知记忆检索机制和统一自注意力架构,系统能保持时空一致性,实现了从"生成片段"到"构建世界"的进化。该技术采用3A游戏数据+真实场景训练,通过剪枝、量化等优化手段

文章图片
#人工智能#音视频
WaveSpeedAI是世界上第一个接Wan 2.2 API的平台

WaveSpeedAI成为全球首个支持Wan2.2API的平台,为AI视频生成带来重大突破。该平台整合100+开源/闭源模型,通过自研技术将生成速度提升2-10倍,成本降低30-70%。Wan2.2API以每个视频0.05美元的超低价提供电影级镜头运动、情感表达和照片级写实效果,成为最佳开源视频模型。WaveSpeedAI凭借技术实力率先接入该API,为创作者提供高效低成本的视频创作方案,推动AI

文章图片
#AIGC#人工智能
Cursor承认Composer 2核心基座源自国产大模型Kimi,双方已达成授权合作

本周,全球AI编程领域发生了一起极具戏剧性的“反转”事件。长期被视为硅谷AI明星初创公司的Cursor,在发布其号称拥有“巅峰级编程智慧”的新一代模型Composer 2后,迅速陷入了一场关于技术原创性的信任危机。不同于以往的技术迭代赞美,这次迎接他们的是来自开发者社区的“代码 forensic(取证)”。

文章图片
#composer#php#人工智能 +1
HappyHorse力压Seedance2.0登顶,幕后团队曝光:疑似阿里P11张迪领衔

阿里旗下HappyHorse模型在全球权威AI视频榜单Artificial Analysis上登顶,以1355分大幅领先第二名字节跳动82分。该模型由"可灵之父"张迪团队5个月打造,展现了阿里从基础设施到模型层的全栈AI实力。HappyHorse的胜出打破了国内AI视频格局,证明技术壁垒尚未固化,人才流动和全栈布局正重塑行业竞争。评测体系的成熟也使AI竞争更透明,推动行业从营销

文章图片
#开发语言#AIGC
小米OmniVoice开源600+语种TTS模型,中文准确率吊打ElevenLabs?

小米开源OmniVoice语音合成模型实现技术突破,支持600多种语言并达到SOTA水平。该模型采用创新架构,合成速度达实时40倍,中文识别准确率WER仅0.84%,超越主流商用产品。其零样本克隆功能仅需3秒音频即可复制声音,并支持个性化调整。特别值得一提的是,该技术为小语种数字化保护提供可能。项目完全开源,将大幅降低语音合成技术门槛,推动有声书、虚拟主播等应用发展。

文章图片
#AIGC#人工智能
    共 68 条
  • 1
  • 2
  • 3
  • 7
  • 请选择