logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

VisualTrap:一种针对 GUI Agent 的隐蔽视觉后门攻击

VisualTrap: A Stealthy Backdoor Attack on GUI Agents via Visual Grounding Manipulation

#人工智能#语言模型#深度学习 +2
论文Crossing the Reward Bridge: Expanding RL with Verifiable Rewards Across Diverse Domains

这篇工作的核心亮点在于Agentic Environment 的可扩展性(agentic env scaling):如何在缺乏结构化答案、标注成本高、领域多样化的复杂环境中,高效构建可靠的强化学习奖励信号,从而让小模型(7B)通过RL获得远超大模型的推理能力。

文章图片
#人工智能#深度学习#机器学习
AppWorld:一个全新的交互式编码代理基准,专治“简单API调用”不够用

AppWorld: A Controllable World of Apps and People for Benchmarking Interactive Coding Agents

文章图片
#人工智能#机器学习
DeepSearch:通过蒙特卡罗树搜索克服可验证奖励强化学习的瓶颈

DeepSearch: Overcome the Bottleneck of Reinforcement Learning with Verifiable Rewards via Monte Carlo Tree Search

文章图片
#人工智能#深度学习#机器学习
DALL-E的论文《Zero-Shot Text-to-Image Generation》解析

这篇论文提出了一种基于大规模自回归 Transformer 的简单方法,用于从文本生成图像,并在零样本(zero-shot)场景下展现了惊艳的表现。以下将详细介绍其核心思想、技术细节和数学公式,适合熟悉 Transformer 和 LLM 的研究者深入理解。

#深度学习#transformer#人工智能
《Simulating Environments with Reasoning Models for Agent Training》论文深度解读

这篇论文不只是提出新框架,更在挑战我们对“环境工程”的认知:为什么不让LLM本身成为模拟器?它用最小工程换取最大scalability,实证上让开源模型逼近甚至超越GPT-4o。

文章图片
#机器学习#人工智能
探索代码空间的AI驱动代理:AIDE论文解读

论文介绍了AIDE(AI-Driven Exploration),一个基于大型语言模型(LLM)的机器学习工程代理,旨在自动化机器学习模型开发的试错过程。

文章图片
#人工智能
DeepSpeed ZeRO Stage 2:梯度分区原理详解与示例

reduce-scatter 后:GPU0 只收 g1 的平均值((g1_0 + g1_1 + g1_2 + g1_3)/4),删 g2~g4。GPU1 收 g2 的平均,依此类推。

#人工智能#机器学习
Vision Transformer (ViT):将Transformer带入计算机视觉的革命性尝试(代码实现)

ViT的核心思想大胆而简单:如果Transformer在NLP中能处理单词序列(Token Sequence),为什么不能将图像也看作一种序列呢?作者提出,通过将图像分割成固定大小的Patch,并将这些Patch作为输入序列直接交给标准Transformer处理

文章图片
#transformer#计算机视觉#深度学习
LLM 中的代码解释器:以 Qwen-Agent 为例详解其必要性和实现原理

Qwen-Agent 的code_interpreter是框架的内置工具,基于 Python 实现,非沙盒化(即在用户 Python 环境中运行)。它通过工具注册和函数调用机制集成到代理中。

#人工智能
    共 470 条
  • 1
  • 2
  • 3
  • 47
  • 请选择