logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

别再卷参数了!LLM 奖励模型才是让 AI 听话的终极杀器!

作为中间方案,既保留语义完整,又能捕捉局部优化空间,在对话对齐等任务中表现突出:既能按语义单元评估,又通过动态权重聚合全局优化,让模型“每写一句都知是否偏离目标”。追踪生成每步决策(如句子、子任务),提供实时反馈,像老师逐段点评作文般解决“信用分配”难题,尤其适配智能体多步骤任务,助其及时修正偏差,避免最终失误。,作为介于响应级和 token 级之间的中间粒度,既携带明确语义信息,又能缓解稀疏奖励

#人工智能#机器学习#算法
NeurIPS 2025 | 华科大NAUTILUS:基于物理先验,让多模态大模型看穿深海迷雾!

摘要:论文提出NAUTILUS模型,用于解决水下图像颜色失真、细节模糊等问题。通过构建145万问答对的大规模水下多任务数据集NautData,并设计基于物理先验的视觉特征增强(VFE)模块,该模型能在特征层面逆向修复水下图像退化信息。实验表明,NAUTILUS在目标检测、分类等8项任务上性能显著提升,尤其在恶劣水下环境中表现出强鲁棒性。该研究为水下智能探索提供了新基准,其可解释的物理建模方法和即插

文章图片
#人工智能#机器学习#深度学习
2025 | 上海交大首个「类人脑」大模型诞生,重塑机器学习范式!

上海交通大学团队提出BriLLM(Brain-inspired Large Language Model),采用"SiFu(Signal Fully-connected flowing)学习"范式,通过"静态语义节点+动态电生理式信号传播"机制重构语言生成过程。该模型具有结构内生可解释性、推理复杂度与上下文长度解耦等优势,并采用稀疏共享策略降低参数规模。小规

文章图片
#机器学习#人工智能#语言模型 +2
AAAI 2026 新鲜出炉!17.6%神仙录取率,揭秘Hinton、LeCun都关注的7大AI风口!

AAAI2026会议聚焦大模型前沿研究,精选7篇核心论文。研究涵盖:1)基于梯度表示优化的推理增强方法;2)MLLM指导的多模态嵌入学习;3)强化学习的视觉语言模型后门防御;4)上下文依赖表情符号消解基准测试;5)功能感知的低秩适配初始化策略;6)视觉语言模型的细粒度因果追踪框架;7)语言可分离性指导的多语言数据预选方法。这些研究为大模型推理、安全、应用等关键问题提供了创新解决方案。论文合集可通过

文章图片
#人工智能#深度学习#机器学习
EMNLP 25 获奖论文合集 | 最佳论文封神!PB级数据搜索终结悬案,GPT-4o被指“严重污染”

EMNLP2025最佳论文解析:聚焦NLP前沿突破 EMNLP2025会议在苏州举行,共接收1600篇论文,整体接收率21.3%。最佳论文奖授予《INFINI-GRAMMINI》,该研究创新性地采用FM-index数据结构,实现PB级文本的高效精确n-gram搜索,为LLM训练数据审计提供关键工具。7篇杰出论文覆盖多个前沿领域:LINGGYM构建首个低资源语言元语言推理评估基准;ValueActi

文章图片
#人工智能#机器学习#深度学习 +1
transformer+强化学习 | 思路简单,发文快人一步!

Transformer与强化学习(RL)的融合正成为决策智能领域的研究热点。这一新范式通过Transformer强大的时序建模能力,有效解决了传统RL在长时序依赖、离线数据利用率、安全约束平衡等方面的难题。目前研究聚焦三大方向:离线RL的序列化建模、安全约束的动态适配以及情景RL的效率优化。两篇代表性论文展示了该方向的创新成果:《Constrained Decision Transformer》通

文章图片
#transformer#深度学习#人工智能 +3
AAAI 2026 新鲜出炉!17.6%神仙录取率,揭秘Hinton、LeCun都关注的7大AI风口!

AAAI2026会议聚焦大模型前沿研究,精选7篇核心论文。研究涵盖:1)基于梯度表示优化的推理增强方法;2)MLLM指导的多模态嵌入学习;3)强化学习的视觉语言模型后门防御;4)上下文依赖表情符号消解基准测试;5)功能感知的低秩适配初始化策略;6)视觉语言模型的细粒度因果追踪框架;7)语言可分离性指导的多语言数据预选方法。这些研究为大模型推理、安全、应用等关键问题提供了创新解决方案。论文合集可通过

文章图片
#人工智能#深度学习#机器学习
大模型前沿周报 (11.17-11.23):覆盖领域专用LLM与多智能体架构,LLM推理、表征优化与逻辑建模等方向

本期精选10篇大模型前沿论文,涵盖多个研究方向:1)领域专用LLM与多智能体架构,如OpenBioLLM开源基因组问答框架;2)LLM推理优化与逻辑建模,包括ProRAC神经符号推理框架;3)评估基准与安全隐私,如MermaidSeqBench图表生成评估基准和CIMemories隐私风险评估;4)跨领域应用与伦理影响,包括自动驾驶行为分析及公平算法操纵风险研究。这些成果展示了LLM在性能提升、安

文章图片
#架构#人工智能#深度学习 +2
陈丹琦团队再出重磅!SLIM框架破解长程Agent上下文难题,ICLR 2026已投!

陈丹琦团队提出SLIM框架,破解长程智能体搜索的上下文管理难题。该研究针对现有框架因上下文溢出、工具预算耗尽等问题导致的性能下降,创新性地将检索拆分为独立搜索与浏览工具,并引入周期性轨迹总结机制。实验显示,SLIM在BrowseComp和HLE基准上分别达到56%和31%的准确率,超越开源基线8-4个百分点,同时减少4-6倍工具调用。该框架在o3、o4-mini和Claude-4-Sonnet等不

文章图片
#人工智能#机器学习#深度学习 +1
超越思维链!邱锡鹏团队定义AI推理新范式:“视频思考”,让GPT-4o看到都得点赞!

【摘要】复旦大学邱锡鹏团队提出创新性"视频思考"范式,突破现有"文本/图像思考"在动态推理和多模态融合上的局限。研究构建了包含4149个样本的VideoThinkBench基准测试集,涵盖视觉中心与文本中心两大任务类别。实验显示,Sora-2在视觉推理任务上与主流视觉语言模型性能相当,在文本推理任务上取得MATH 92%、MMMU 75.53%的准确率。研究

文章图片
#人工智能#音视频#机器学习 +2
    共 29 条
  • 1
  • 2
  • 3
  • 请选择