logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Claude Code泄露的源码里,藏着一套让AI学会「做梦」的记忆架构

当满足以下条件时触发会话记忆提取:自上次提取以来的 token 增长量大于最低更新 token 间距,并且(自上次提取以来的工具调用次数大于工具调用更新间距,或在最近的助手交互轮次中没有工具调用)。总有一些你不认识的人,知道你想知道的东西。在所有被曝光的内部机制中,除了作为彩蛋的电子宠物(BUDDY),最具技术深度且最引人瞩目的,是 Claude Code 底层那套庞大且精密的。这一机制在逻辑上高

博士申请 | 南方科技大学-鹏城实验室招收多模态深度学习方向联培博士生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!南方科技大学-鹏城实验室南方科技大学(简称:南科大)是深圳在中国高等教育改革发展的时代背景下创建的一所高起点、高定位的公办新型研究型大学。2022年学校入选“双一流”建设高校及建设学科名单。学校借鉴世界一流理工科大学的学科设置和办学模式,以理、工、医为主,兼具商科和特色人文社科

#科技#深度学习#人工智能
DeepSeek-R1技术剖析:没有强化学习基础也能看懂的PPO & GRPO

©PaperWeekly 原创 ·作者 |张逸骅单位 |密歇根州立大学博士生研究方向 |可信人工智能开篇在强化学习(RL)中,如果我们只知道“做对了能拿多少分”,那往往还不够,因为单纯追求高分可能带来种种副作用,比如过度搜索、模型不稳定、甚至“走捷径”而偏离合理范围。为了解决这些问题,人们在 RL 中设计了许多机制——Critic(价值函数)、Clip 操作、Reference Model...

博士申请 | 香港科技大学(广州)聂强老师招收人工智能全奖博士/博后/RA

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港科技大学(广州)香港科技大学(简称港科大、HKUST)自1991年创立以来,秉持锐意创新、与时并进、博大包容、坚持原创的理念, 在教育、科研和知识转移等方面均取得长足进展。短短三十年间,港科大于全球高校排名节节上升,被公认为全球首屈一指的年轻学府。香港科技大学(广州)可以.

#人工智能
NeurIPS 2024 | 全面重新评估!经典GNN是强有力的节点分类基线模型

©PaperWeekly 原创 ·作者 |罗元凯单位 |北京航空航天大学、香港理工大学研究方向|图神经网络本文简要介绍了经典图神经网络(GNNs)的基准分析研究,发表在 NeurIPS 2024。文章回顾了经典 GNNs 模型在节点分类任务上的表现,结果发现过去 SOTA 图学习模型报告的性能优越性可能是由于经典 GNNs 的超参数配置不佳。通过适当的超参数调整,经典 GNNs 模型在 ...

#分类#数据挖掘#人工智能 +2
北京/上海/深圳内推 | 月之暗面招聘音频/视频大模型方向算法工程师/实习生

合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!月之暗面北京月之暗面科技有限公司(Moonshot AI)是一家专注于通用人工智能研究和应用的高科技企业。公司主要业务领域包括人工智能算法研究、自然语言处理、计算机视觉、分布式机器学习系统、大数据分析等。其目标是以大规模语言模型为技术基础,开发通用人工智能系统,以准确、高性能、

#音视频
Neural Networks (CCF-B) 特刊征稿:大语言模型时代的模型压缩

简介大语言模型(LLMs)作为基于神经网络的大规模预训练统计语言模型系列,在自然语言处理、多智能体系统和多模态AI等多个领域取得了显著成功。由于应用场景广泛,LLMs 面临显著的效率挑战。直接在个人电脑和智能手机等边缘设备上部署拥有数十亿参数的LLMs几乎是不可能的。这些场景为LLMs时代的模型压缩研究提供了强大动力,例如模型量化、稀疏化和蒸馏,可以降低计算成本并加速推理。然而,仍有若干挑战阻碍了

#语言模型#人工智能#自然语言处理
科研速递 | TPAMI 2025:深度神经网络模型对抗攻击与防御平台 A³D开源发布

平台集成了多种神经网络架构搜索方法,覆盖多种类型鲁棒性评估指标,如范数对抗攻击、语义对抗攻击、对抗伪装和可量化指标等,可实现自动搜索适配当前攻击算法的最优鲁棒网络模型架构。最后,平台将自动对抗攻击和自动对抗防御结合形成一个统一的框架,借助攻防博弈思想,不断迭代升级,一方面加固模型防御性能,另一方面增强对抗攻击性能,以提升对抗攻防效果。自动对抗攻击方面,通过基于自动机器学习的组合对抗攻击,构建攻击参

#dnn#人工智能#神经网络 +2
CVPR 2024 | 上交大、上海AI Lab联合提出StoryGen: 开放式视觉故事生成

近年来,以扩散模型为代表的生成式 AI 模型能力日新月异,尤其是近期 OpenAI 的文本到视频的生成模型 Sora,展现出了惊人的超长上下文关注能力,实现了连贯一致的长视频生成。针对视频/图像序列生成过程中的一致性这一难题,上海交通大学与上海人工智能实验室联合团队提出了利用 AIGC 技术进行故事讲述,探索了一项新颖且极富挑战性的任务——开放式视觉故事生成(open-ended visual s

#人工智能
ICLR 2025 Workshop 征稿:推动基础模型的开源、开放、可复现

国际学习表征会议 ICLR 作为深度学习领域的顶级学术活动,将于 2025 年 4 月 24-28 日在新加坡举办。期间,首届 Open Science for Foundation Models (SCI-FM) Workshop 将在会场同步开启,现面向业界进行征稿。时下,基础模型(Foundation Models)在自然语言处理、计算机视觉、语音识别和多模态理解等领域展现出显著价值。然而,

    共 1685 条
  • 1
  • 2
  • 3
  • 169
  • 请选择