Amusi（CVer）个人主页

@amusi1994

Amusi（CVer）

2022-07-08 17:25:29 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

NeurIPS 2025 | 英伟达发布Nemotron-Flash：以GPU延迟为核心重塑小模型架构

Nemotron-Flash 的速度与稳定性让小模型真正具备 “可规模部署” 的能力，能够在关键业务场景中提供持续、可靠且低延迟的体验 —— 例如在高并发在线服务中（如搜索助手、智能客服），更快的响应与更高吞吐意味着同样的 GPU 可以服务更多用户且体验更顺滑；通过这套方法，小模型摆脱了 “虽然小但不快” 的悖论，真正实现了：小而强，小而快，小而可用。Nemotron-Flash 的结果显示，小

#人工智能

临床PK完胜ChatGPT-5！国内团队造出首个OCT影像AI系统

在这项纳入了 96 名患者、160 处病变的临床研究中，团队构建了一个严苛的竞技场：将 CA-GPT 系统、ChatGPT-5 以及拥有 1-5 年经验的初级介入医师放在同一维度下，以资深专家团队制定的手术记录为金标准进行盲测。在 PCI 手术中，OCT（光学相干断层成像）被称为医生的「第三只眼」，可清晰看到血管内病变情况，但是其图像解读高度依赖医生经验，初级医师与资深专家在手术成功率、并发症发生

#人工智能

4090单卡跑满血版DeepSeek-R1！清华团队开源项目再破大模型推理门槛！

点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达点击进入—>【Mamba/多模态/扩散】交流群添加微信号：CVer2233，小助手会拉你进群！扫描下方二维码，加入CVer学术星球！可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料，及最前沿应用！发论文/搞科研/涨薪，强烈推荐！转载自：量子位DeepSeek-R1火遍海内外，但推理服务器频频宕机，专享版按GPU小

具身智能VLA综述指南：全面梳理 VLA 20大挑战

总体来看，这一时间线覆盖了从对齐、大模型、开源框架，到强化学习与世界模型等多条核心技术路线，勾勒出 VLA 从“能跑 demo”走向“可持续、可扩展具身智能体”的范式迁移，也为后续围绕核心挑战的系统分析提供了清晰的发展脉络定位。在总结现有研究的基础上，综述描绘了未来可能方向：例如“原生多模态架构”（从训练伊始就统一模态表示）、融合物理与语义的因果世界模型（能预测后果、推演未来），以及具备“自我觉察

#人工智能

刚刚，OpenAI清华校友宋飏跳槽到Meta，担任超级智能实验室研究负责人

今年夏天，扎克伯格在一份发给全体员工的备忘录中，盛赞了赵晟佳令人印象深刻的履历，称其是 OpenAI ChatGPT、GPT-4、所有迷你模型、4.1 和 o3 的共同创造者 —— 但他并未具体说明赵晟佳在 Meta 的新职位。7 月份，扎克伯格在 Threads 的一篇帖子中写道，虽然赵晟佳「是实验室的联合创始人」，并且「从第一天起就是我们的首席科学家」，但 Meta 决定「正式确立他的领导角色

#跳槽 #人工智能 #计算机视觉 +1

重磅！上海交大&华为诺亚提出MURE：靠“图文交织思维链”终结AI改图“开盲盒”时代！

与其他数据集仅提供“指令+结果”不同，CoT-Edit-14K 的每条数据都包含完整的**“文字思考链 + 视觉中间产物”**，详尽记录了模型在每一步如何思考、如何生成 Mask、如何预览，为模型训练和领域研究提供了关键且独特的基准。若你做文字驱动图像编辑，或被AI改图的“不精准、不稳定”困扰，可以关注一下 MURE——其图文交织思维链不仅是当前改图任务的“最优解”之一，更可能为未来视频编辑、3D

#人工智能

北航90后美女副教授网上讲课走红，校方回应

其中一篇校方报道提到，作为一位90后的青年学者，何静老师兼具深厚的学术背景与创新的实践精神。她并未停留在理论的空中楼阁，而是从一线行政办公的实际痛点出发，为在场的老师们打开了一扇通往智能化办公的新大门。教学工作包括研究生课程《文本数据分析与挖掘》《文化传播与管理专题》《应急管理前沿与技术》，本科生课程《网络舆情分析技术》《自媒体创作与运营》《新媒体运营》《工程哲学》。（用户10万+，覆盖高校百余所

#美女

李飞飞&LeCun&谢赛宁首次联手！Cambrian-S：迈向视频中的空间超感知

他的研究兴趣主要集中在机器学习和计算机视觉领域，重点探索多模态大语言模型在推理、智能体、长视频理解、空间智能和统一模型方面的研究，以及它们在现实世界中的应用与落地。简单说就是，这三位巨头认为LLM目前虽然能力很强，但依然无法像人类一样感知这个世界，既然无法感知，代表LLM是有缺陷的。真正意义上的超感官智能，不仅需要具备看见的能力，更要能通过构建内部世界模型，主动地预判、筛选并组织其所接收的感官信息

#人工智能

新突破！阿里提出Lumos-1：自回归离散扩散视频生成模型

这样，同一空间位置的词元在所有帧中，要么同时可见，要么同时被遮蔽，从而有效切断了空间信息泄露的“捷径”，迫使模型依赖时序上下文进行预测。Lumos-1模型，核心目标是在尽可能保留LLM原生架构的基础上，构建一个不依赖外部文本编码器、并能实现高效训练推理的自回归视频生成器，从而为构建统一基础模型提供一个坚实且可行的技术路径。否则，生成的视频会出现明显的伪影和闪烁。这一操作确保了两种模态的位置编码处于

#回归 #数据挖掘 #人工智能 +2

周志华团队新作：LLM中存在奖励模型，首次理论证明RL对LLM有效性

本评估还在附录 E 中给出了模型在强化学习前后的响应示例，从中可以看出，对于同一个问题，在基于内源性奖励进行优化之前，模型无法解决问题，并且随着响应的进行开始胡言乱语，甚至输出 Python 代码。这篇论文提出了解决 LLM 的对齐问题，通过利用模型内部的奖励机制，而不是依赖外部的人类反馈，这可能会改变未来 LLMs 的开发和应用方式。表 1 中的结果显示，EndoRM 不仅显著优于所有使用相同基

#人工智能

共 994 条

请选择