logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从简单助手到强生产力,香港大学黄超团队的AI Agent落地攻坚实录

近年来,大语言模型正在加速由对话工具迈向自主智能体,OpenClaw 等成为这一转变的重要里程碑。与此同时,Agent 系统代码量急剧膨胀(OpenClaw 已超百万行),架构臃肿与效率瓶颈,使得「轻量化」和「生产力化」成为演进的关键命题。如何让 Agent 从简单助手进化为真正参与工作的数字协作者,正成为产业界与学术界共同聚焦的前沿议题。在 2026 北京智源大会上,系统阐述了他关于 AI Ag

文章图片
#人工智能
从简单助手到强生产力,香港大学黄超团队的AI Agent落地攻坚实录

近年来,大语言模型正在加速由对话工具迈向自主智能体,OpenClaw 等成为这一转变的重要里程碑。与此同时,Agent 系统代码量急剧膨胀(OpenClaw 已超百万行),架构臃肿与效率瓶颈,使得「轻量化」和「生产力化」成为演进的关键命题。如何让 Agent 从简单助手进化为真正参与工作的数字协作者,正成为产业界与学术界共同聚焦的前沿议题。在 2026 北京智源大会上,系统阐述了他关于 AI Ag

文章图片
#人工智能
从简单助手到强生产力,香港大学黄超团队的AI Agent落地攻坚实录

近年来,大语言模型正在加速由对话工具迈向自主智能体,OpenClaw 等成为这一转变的重要里程碑。与此同时,Agent 系统代码量急剧膨胀(OpenClaw 已超百万行),架构臃肿与效率瓶颈,使得「轻量化」和「生产力化」成为演进的关键命题。如何让 Agent 从简单助手进化为真正参与工作的数字协作者,正成为产业界与学术界共同聚焦的前沿议题。在 2026 北京智源大会上,系统阐述了他关于 AI Ag

文章图片
#人工智能
从简单助手到强生产力,香港大学黄超团队的AI Agent落地攻坚实录

近年来,大语言模型正在加速由对话工具迈向自主智能体,OpenClaw 等成为这一转变的重要里程碑。与此同时,Agent 系统代码量急剧膨胀(OpenClaw 已超百万行),架构臃肿与效率瓶颈,使得「轻量化」和「生产力化」成为演进的关键命题。如何让 Agent 从简单助手进化为真正参与工作的数字协作者,正成为产业界与学术界共同聚焦的前沿议题。在 2026 北京智源大会上,系统阐述了他关于 AI Ag

文章图片
#人工智能
论文周报 | DeepMind D4RT统一动态4D重建,推理速度飙升300倍;打破AGI通用幻想,哥大等提出SAI理论重塑AI演进目标...速览一周AI前沿论文

理解和重建动态视频中的复杂几何形状与运动轨迹,一直是计算机视觉领域的重大挑战。传统的解决方案往往依赖碎片化的特定任务模型拼凑,或是深陷于计算昂贵的逐帧迭代优化之中。为此,Google DeepMind 联合牛津大学与伦敦大学学院(UCL)的研究团队彻底颠覆了刚性的帧级解码思路,该架构的核心创新在于引入了高度灵活的「按需查询(querying)」机制。视频在被编码为全局场景的潜在表示后,模型允许轻量

文章图片
#人工智能
支持真人/动漫/动物驱动,美团开源多风格音频驱动视频生成框架LongCat 1.5;百万级图表理解数据集ChartNet提升VLM图表重建与表格提取能力

Gemma 4 12B-it 是 Google DeepMind 发布的 Gemma 4 系列统一多模态模型,采用 encoder-free 架构,将图像和音频直接投影到 LLM 的嵌入空间中,无需独立的编码器即可处理文本、图像和音频三种模态,在 12B 参数量级实现了强大的推理、编码和多模态理解能力。剑桥大学、阿尔托大学、布里斯托大学的联合研究团队基于巴洛双子算法构建了一种新的时序特征学习范式,

文章图片
#音视频
当多模态开始卷落地:MiniCPM-o-4.5仅9B覆盖实时图像理解与文本生成;vLLM Omni 同时支持文本与多模态模型的高吞吐部署与服务化

「HyperAl 超神经为大家整理了 2.22-2.27 期间一系列极具价值且应用广泛的教程和数据集,涵盖OCR、多模态、 大语言模型 等多个领域~」

文章图片
#人工智能#神经网络#深度学习 +2
Free CPU在线教程 | Hermes Agent学会长期记忆?记忆增强插件TencentDB Agent Memory可将事实/偏好/任务状态等分开存储

从个人效率工具到复杂工作流自动化,再到长期协作型数字员工,Agent 正在从「会使用工具」迈向「会学习、会记忆、会成长」的新阶段。不同于传统 AI 助手「完成任务即结束」的运行模式,Hermes 能够从执行过程中的经验中自动提炼技能、持续优化决策策略,并通过子 Agent 委托机制实现复杂任务的并行处理,显著提升长期任务执行能力。1.进入 hyper.ai 首页后,选择「教程」页面,或点击「查看更

文章图片
#人工智能#深度学习
基于Gemini 1.5长上下文能力,谷歌对话式医疗系统AMIE在100例多次就诊场景中达到全科医师的推理水平

这项研究的价值,不在于证明医疗大模型已经可以替代医生,而在于把评估重点从「能否诊断」推进到了「能否持续管理」。相比单轮问答,管理推理更接近真实临床:医生需要在病程变化、治疗反馈、指南证据和患者个体差异之间不断调整判断。研究提出的多就诊虚拟OSCE、指南知识库、药物专项基准和双智能体系统,为医疗AI评测提供了更贴近临床的框架。但虚拟环境仍无法完全还原真实医疗中的身体检查、资源限制、患者依从性和责任边

文章图片
#人工智能
基于Gemini 1.5长上下文能力,谷歌对话式医疗系统AMIE在100例多次就诊场景中达到全科医师的推理水平

这项研究的价值,不在于证明医疗大模型已经可以替代医生,而在于把评估重点从「能否诊断」推进到了「能否持续管理」。相比单轮问答,管理推理更接近真实临床:医生需要在病程变化、治疗反馈、指南证据和患者个体差异之间不断调整判断。研究提出的多就诊虚拟OSCE、指南知识库、药物专项基准和双智能体系统,为医疗AI评测提供了更贴近临床的框架。但虚拟环境仍无法完全还原真实医疗中的身体检查、资源限制、患者依从性和责任边

文章图片
#人工智能
    共 522 条
  • 1
  • 2
  • 3
  • 53
  • 请选择