
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
系统覆盖Claude Code AI编程智能体、OpenClaw个人AI代理、SubAgent多智能体并行架构、MCP工具生态、Skills技能扩展等核心技术,并深度横评GPT、Claude、Gemini、DeepSeek等七大主流模型的科研能力差异。一次学全,体系化掌握。培训规模:从2017年至今累计完成300+场线下深度培训,培训科研人员超过20,000人,其中80%为高校教师、教授、研究生、
然而,正是这种“大权在握”的核心地位,使得 Harness 成为了极具价值的攻击面:哪怕只是框架层面的单点妥协(例如一条被投毒的工具输出),风险也会顺着执行管道级联放大到整个系统。与无保护的基线相比,SafeHarness 使智能体的 不安全行为率(UBR)平均降低了约 38%,攻击成功率(ASR)平均降低了 42%。为了解决上述痛点,SafeHarness 提出了一个核心洞察:智能体执行的四个阶
目前,NICE 已构建起覆盖中、美、欧的国际化团队,正加速在硅谷、纽约、香港等地落地,致力于打造连接学术、产业与未来的全球化 AI 前沿社区。2024 年博士毕业于香港中文大学,研究方向为大模型安全和大模型应用,近五年发表 A 类论文 40 余篇,发表论文获 ACM SIGSOFT 杰出论文奖,EMNLP最佳论文提名,深圳科协优秀论文奖。在本次分享中,我们将跳出枯燥的代码和算法表象,从高维的哲学视
针对这一挑战,我们提出了SwS(Self-aware Weakness-driven Problem Synthesis)框架,无需人工标注微调或外部知识蒸馏,利用模型自我感知的弱点驱动自动化问题生成,精准锁定模型持续难以掌握的关键难题,并据此合成高度针对性的训练数据。具体而言,该方法首先通过初步的强化学习阶段主动识别模型在自我探索过程中暴露出的薄弱环节,随后基于这些弱项合成针对性的问题,并将这些
针对这一挑战,我们提出了SwS(Self-aware Weakness-driven Problem Synthesis)框架,无需人工标注微调或外部知识蒸馏,利用模型自我感知的弱点驱动自动化问题生成,精准锁定模型持续难以掌握的关键难题,并据此合成高度针对性的训练数据。具体而言,该方法首先通过初步的强化学习阶段主动识别模型在自我探索过程中暴露出的薄弱环节,随后基于这些弱项合成针对性的问题,并将这些
然而,现有的零强化学习(zero-RL)方法本质上是"同策略"(on-policy)的,这限制了模型只能从自身输出中学习,无法获得超出其初始能力的推理能力。分析表明,LUFFY不仅能有效模仿,还能探索超越示范的空间,为使用离策略指导训练可泛化的推理模型提供了一条可扩展的路径。每周进行学术分享,形式包括圆桌会议、主题分享、单篇论文深度分享等,内容覆盖论文分享、科研小白入门、PhD择业等所有学术领域。
本文转自新智元【导读】MIT CSAIL的研究人员发现,LLM的「内心深处」已经发展出了对现实的模拟,模型对语言和世界的理解,绝不仅仅是简单的「鹦鹉学舌」。也就说,在未来,LLM会比今天更深层地理解语言。LLM离世界模型,究竟有多远?去年,MIT的一篇文章发现了惊人的结论:在LLM内部,存在一个世界模型。LLM不仅学习了表面的统计数据,还学习了包括空间和时间等基本纬度的世界模型。Llama-2-7
深度学习自然语言处理 分享整理:pp摘要:联合嵌入预测架构Joint-Embedding Predictive Architecture(JEPA)是一种很有前途的自监督方法,它通过利用世界模型进行学习。虽然以前仅限于预测输入中的缺失部分,但我们探索了如何将 JEPA 预测任务推广到更广泛的损坏数据集。我们引入了图像世界模型Image World Models (IWM),这是一种超越遮蔽图像建模
知乎:木尧(已授权)链接:https://zhuanlan.zhihu.com/p/20538667476编辑:「深度学习自然语言处理」公众号总览最近在研究和复现 DeepSeek-R1(671B 参数 MoE,激活 37B 参数,128K 上下文的深度思考模型)论文,于是画了三张图来把整个论文核心内容总结一下,欢迎大家讨论!核心是三组模型:一是纯强化学习(后文简称 RL)方案训的 DeepSee
每天给你送来NLP技术干货!来自:SUFE AI Lab标题:Adversarial Mixture Of Experts with Category Hierarchy Soft Constraint期刊:ICDE 2021商品搜索引擎是电商平台满足用户购物需求的一个重要系统,它根据用户输入的搜索词,返回个性化的排序列表。商品一般会被归为某一大类下某个小类目,例如电子产品,在电子产品这个大类目下







