DXL_note 个人主页

@qq_22337877

DXL_note

2024-05-10 10:23:44 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Agent目前最全综述-ADVANCES AND CHALLENGES IN FOUNDATION AGENTS-5

本文探讨了人类与AI智能体的奖励机制差异及智能体奖励范式的设计。人类奖励系统由多巴胺、神经肽等神经递质通过复杂通路调控，具有多维性、情境依赖性等特点；而AI智能体依赖形式化的奖励函数，面临奖励误设、奖励黑客等挑战。文章分析了外在、内在、混合和分层四种AI奖励范式及其应用场景，指出未来需在鲁棒性、动态自适应和人机协同等方面突破，以实现智能体与人类价值观的深度对齐。这一研究对构建可靠AI系统具有重要意

#人工智能

QvQ - Qwen 的新视觉推理模型

QVQ是阿里巴巴基于Qwen2-VL-72B构建的一款开源多模态推理模型。其核心目标是将视觉理解能力与复杂问题解决能力深度融合，以此提升人工智能系统的整体认知水平，推动人工智能向更智能、更全能的方向发展，使其能够在复杂场景下进行深度思考和推理，进而参与到各类科学探索活动中。

#人工智能

Anthropic工程师亲述：打造Claude Code，我学会了“像Agent一样思考”

Thariq在文章结尾强调：如果你想找一套“构建Agent工具”的严格规则，很遗憾，没有这样的规则。为模型设计工具，既是一门科学（需要遵循技术逻辑），也是一门艺术（需要结合模型能力、Agent目标、运行环境灵活调整）。多实验、读输出、尝新方法。像Agent一样看世界。

#人工智能

Claude新功能上线！无代码实时生成交互式可视化内容，聊天更直观

实际使用中，这个功能的实用性拉满，举两个常见场景就能明白：想了解复利的运作原理，向Claude提问后，它会生成可交互的曲线图表，让你直观感受复利变化；而新的可视化内容是为辅助话题理解而生，直接嵌入在对话流中，并非展示在侧边栏，且属于临时内容，会随着对话的推进动态变化甚至消失。这款新功能能让Claude在回复中直接生成图表、示意图等可视化内容，且支持动态调整——随着对话的深入，用户可随时要求Clau

#人工智能

办公效率拉满！Claude重磅升级Excel/PPT插件，跨软件协同+一键复用工作流

插件新增「自定义指令」功能，可设置长期生效的应用级偏好规则，设置一次，Claude就会自动适配，不用反复提醒，贴合企业办公规范。示例：Excel中统一使用公司专属数字格式、PPT项目符号仅限单行显示、自动标记表格中引用硬编码假设的单元格；甚至Claude还能协助编写、编辑这些指令，省心又高效。

#人工智能

Claude 重大更新！可直接操控你的电脑，无需手动设置

Claude 此次推出的电脑操控功能，仍处于研究预览阶段，并非完美——复杂任务可能需要重试，部分场景适配还需优化。之所以提前开放，是希望收集更多用户反馈，明确功能的适用场景与不足，就像当初推出 Claude Cowork 一样，逐步打磨完善。对于经常需要用电脑处理重复任务、跨设备协作的小伙伴来说，这无疑是提升效率的“神器”，感兴趣的可以去尝试一下～

#人工智能

Harnessing Claude 打造高效、低成本、可进化的 AI 应用

驾驭 Claude 的智能，核心不是 “控制它”，而是 “成就它”：善用既有能力，不做无用功；停止过度干预，释放模型潜力；精准设定边界，平衡效率与安全。在 AI 快速进化的时代，最好的应用不是 “固化的成品”，而是能跟着模型一起成长的生态。掌握这三大范式，你打造的不仅是一款 AI 应用，更是能持续迭代、始终领先的核心竞争力。

#人工智能

不用人类动手！Claude化身自动化对齐研究员，5天干赢人类7天，AI全自动科研时代降临

最近Anthropic发布的一项重磅研究，直接颠覆了AI科研的现有范式——以前AI只是科研中的“辅助工具”，帮人类跑数据、写代码、做基础分析；现在，AI直接升级为，能自主提出研究假设、设计实验方案、运行实验、分析结果并迭代优化，甚至在核心科研任务上，实力远超人类研究员！更令人震撼的是，在这一AI对齐核心任务中，AAR仅用5天，就超越了人类研究员7天的成果，直接将“AI全自动搞科研”从概念落地为现实

#人工智能 #机器学习

Agent目前最全综述-ADVANCES AND CHALLENGES IN FOUNDATION AGENTS-4

摘要：本文探讨了AI世界模型如何借鉴人类认知中的"心理模型"机制，实现环境预测与决策优化。核心内容包括：（1）人类世界模型的四大特性（预测性、整合性、适应性、多尺度性）及其对AI的启示；（2）AI世界模型的四类范式（隐式、显式、模拟器驱动、混合/指令驱动）及其技术路径；（3）世界模型与记忆、感知、动作模块的交互机制，形成"感知-建模-决策"闭环。研究指出，未

#人工智能

Agent目前最全综述-ADVANCES AND CHALLENGES IN FOUNDATION AGENTS-2

本文探讨了智能体（如LLM）与人类认知系统的对比与融合。人类认知具有多脑区协同学习、结构化/非结构化推理和动态适应性等特点，而LLM通过预训练、微调和强化学习模拟类似机制。文章分析了两种学习方式：全心理状态学习（修改基础模型参数）和部分心理状态学习（调整特定认知组件）。在推理层面，对比了结构化（显式逻辑）和非结构化（隐式模式）方法，并探讨了规划中的长程整合挑战。当前LLM在感知、推理和世界理解方面

#人工智能

共 61 条

请选择