logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

超越GPT-4o和Gemini 2.5!小米MiMo-Audio音频大模型真香

小米在通用音频智能领域扔出一颗“重磅炸弹”:小米MiMo-Audio大模型,预训练数据规模直接干到1亿多小时的狠角色。在MMSU(多模态语音理解)、MMAU(多模态音频理解)、MMAR(多模态音频推理)、MMAU-Pro(多模态音频理解-专业版)这些业内公认的基准测试里,它成了开源7B(70亿参数)模型里的“天花板”,也就是SOTA(State-Of-The-Art,当前最佳)。小米把所有相关资源

文章图片
#音视频
AI 智能体构建:MCP 协议原理与实战【MVP线上直播】

潘淳老师会从 “智能体时代的协议革新” 切入,深度拆解 MCP 框架的核心价值,让你明白为什么 MCP 能成为 AI Agent 互联的 “关键桥梁”;更会手把手分享 MCP 驱动的智能体构建路径,从原理到实操,哪怕是刚接触智能体开发的新手,也能找到落地方向!当 AI 智能体从概念走向落地,“如何让不同智能体高效协同、稳定交互” 成为开发者核心痛点 —— 而 MCP 协议的出现,正为这场 “智能体

文章图片
#人工智能#大数据
国产MiroMind智能体框架,登顶全球预测未来大模型榜单

一个叫MiroMind的AI公司,在全球首个动态实时预测基准FutureX上拿了第一。老板,是陈天桥。就是那个创办了盛大网络,后来跑去做脑科学研究的陈天桥。从网游、到人脑、再到人工智能,这位大佬好像总在琢磨未来的事。

文章图片
#etcd
中科院类脑大模型SpikingBrain,2%数据,百倍速度

中国科学院自动化研究所的李国齐、徐波团队发布全球首款大规模类脑脉冲大模型SpikingBrain 1.0。处理一段400万token的超长文本,它的速度比现在主流的Transformer模型快了100多倍。更离谱的是,它的训练数据量,只有别人家的2%。

文章图片
#人工智能
Nature重磅:AI和人脑的根本区别找到了,我们对“聪明”的理解可能全错了

一篇发表在2025年《自然·机器智能》(Nature Machine Intelligence)上的研究,像一颗深水炸弹,炸开了人工智能和人类认知之间最深的那道墙。这篇由二十多位国际顶尖专家联手的研究,它告诉我们,AI和人类在“泛化能力”上,压根就不是一回事。什么叫泛化能力?说白了,就是举一反三、活学活用的本事。你给一个小孩看几把椅子,他就能认识世界上所有的椅子,甚至能把一个没见过的墩子也叫“椅子

文章图片
#人工智能
Meta打开AI元认知,让AI不止会解题,还会总结套路了

大语言模型记性不太好。具体来说,它们在解决需要多个步骤的复杂问题时,经常“顾尾不顾头”。比如它刚辛辛苦苦推导出一个几何级数求和公式解了一道题,下一道题遇到类似的问题,它就把刚才的功夫忘得一干二净,又从头开始重新推导一遍。这个过程不仅浪费了大量的计算资源,还拖慢了响应速度。这就像一个学生,每次考试都现场推导勾股定理,而不是直接记住a²+b²=c²。Meta、Mila-Quebec人工智能研究所、蒙特

文章图片
#人工智能
Meta打开AI元认知,让AI不止会解题,还会总结套路了

大语言模型记性不太好。具体来说,它们在解决需要多个步骤的复杂问题时,经常“顾尾不顾头”。比如它刚辛辛苦苦推导出一个几何级数求和公式解了一道题,下一道题遇到类似的问题,它就把刚才的功夫忘得一干二净,又从头开始重新推导一遍。这个过程不仅浪费了大量的计算资源,还拖慢了响应速度。这就像一个学生,每次考试都现场推导勾股定理,而不是直接记住a²+b²=c²。Meta、Mila-Quebec人工智能研究所、蒙特

文章图片
#人工智能
Meta打开AI元认知,让AI不止会解题,还会总结套路了

大语言模型记性不太好。具体来说,它们在解决需要多个步骤的复杂问题时,经常“顾尾不顾头”。比如它刚辛辛苦苦推导出一个几何级数求和公式解了一道题,下一道题遇到类似的问题,它就把刚才的功夫忘得一干二净,又从头开始重新推导一遍。这个过程不仅浪费了大量的计算资源,还拖慢了响应速度。这就像一个学生,每次考试都现场推导勾股定理,而不是直接记住a²+b²=c²。Meta、Mila-Quebec人工智能研究所、蒙特

文章图片
#人工智能
谷歌发布AP2协议,联手PayPal放大招:AI要自己下单了

谷歌大力布局AI支付了!2025年9月17日,它扔了两颗核弹。正式推出智能体支付协议AP2(Agent Payments Protocol)并开源。宣布和全球支付巨头PayPal搞了多年的战略合作。

文章图片
#人工智能
香港中科院发布聆音大模型,400万张图喂出个“AI超声神医”

中国科学院香港创新研究院人工智能与机器人创新中心(Centre for Artificial Intelligence and Robotics, CAIR)发布了一个名为“聆音”(EchoCare)的超声大模型。用一个超过400万张图像的、目前全球已知规模最大的超声数据集,通过“自监督学习”框架,“自学成才”训练出了一个AI。结果是,这个AI在好几项关键的诊断任务上,把之前的最高纪录都给破了。

#人工智能#计算机视觉#深度学习
    共 98 条
  • 1
  • 2
  • 3
  • 10
  • 请选择