登录社区云,与社区用户共同成长
邀请您加入社区
本文介绍了一个学术论文引文系统的实现过程,该系统通过规则抽取、Semantic Scholar API、Neo4j和LangGraph构建引文图谱。系统首先使用正则表达式和置信度分级从PDF中提取参考文献,然后通过Semantic Scholar API获取论文元数据,并利用Neo4j构建引文图谱。文章详细讨论了技术选型(规则抽取优于LLM)、参考文献格式处理、置信度分级策略以及应对API限流的解
ICML 2026将在2026年7月6日—11日于韩国首尔(Seoul, South Korea)举行。本文总结了2026 ICML上有关时空数据(Spatial-Temporal)相关论文。如有疏漏,欢迎大家补充。注:笔者将分为上下2篇推文来总结,本文主要涉及时空数据中有关气象数据,物理时空等论文。本文时空数据Topic:天气预报,物理时空,LLM/MLLM等的应用等。
Posq∈RNA×2Posq∈RNA×2NAN_ANA:锚点数量每个点存储xy(x,y)xy,归一化 0~1网格锚点:均匀铺在图上可学习锚点:随机初始化,跟着训练一起学DETR慢的根源:查询无明确空间责任,注意力散乱难优化。Anchor DETR 解法查询=锚点编码,责任明确,收敛狂快。:一个锚点多模式,解决同位置多物体。RCDA 行列解耦注意力省显存、速度快、硬件友好。最终效果。
只用了很少的真机训练数据(7.5k条),通过“P图”扩充数据和“预测动作片段”而非单步动作,训练出了一个能听懂人话、在没见过的厨房场景里也能完成多种复杂任务的通用机器人。
今日候选池 91 篇,硬过滤 + LLM 打分后通过评估 16 篇,精选 Top-10,另列 6 篇速览
摘要:Meta发布的LLaMA系列开源大语言模型(7B-65B参数)采用完全开源数据训练(1.4万亿tokens),通过架构创新实现高效性能:1)RMSNorm预归一化提升稳定性;2)SwiGLU激活函数增强表达能力;3)RoPE位置编码优化长文本处理。实验显示,13B模型超越GPT-3(175B),65B模型达到SOTA水平。该研究证明小模型+大数据策略的有效性,其技术方案(如SwiGLU、Ro
摘要 本文首次研究了通用Web智能体在对抗环境中的隐私风险。针对涉及个人身份信息(PII)的Web任务,作者提出了环境注入攻击(EIA)方法,通过注入适应网页环境的恶意内容来窃取用户PII或完整请求。实验使用Mind2Web数据集和SeeAct智能体框架,结果显示EIA在窃取特定PII时成功率高达70%,在窃取完整请求时达16%。研究发现EIA难以检测和防御,人工监督虽能发现未良好适配的攻击,但攻
WebInject是一种针对Web智能体的新型提示注入攻击方法,通过操纵网页原始像素值诱导智能体执行攻击者指定动作。该方法将攻击建模为优化问题,旨在最大化目标动作概率的同时保持扰动对用户不可见。为解决网页到截图映射不可微的挑战,作者训练神经网络近似该映射,并采用投影梯度下降求解优化问题。实验表明,WebInject在多个数据集上显著优于现有基线方法,成功率提升0.91。该攻击具有实用可行性,同时兼
今日候选池 85 篇,硬过滤 + LLM 打分后通过评估 11 篇,精选 Top-10,另列 1 篇速览
2026.6.15本文提出 PASS-Tr,通过逐块跨切片 Swin 注意力融合相邻 CT 切片,并接入二维视觉基础模型,以提升通用病灶检测及其他 CT 任务的泛化能力。Title题目01基于逐块 Swin 切片注意力的二维大视觉模型泛化增强通用病灶检测PASS-Tr: PAtch-wise swin slice attention to leverage generalization of 2D
文章摘要: 本文提出一种基于图神经网络(GNN)的低复杂度预编码方法,用于解决低地球轨道(LEO)卫星大规模MIMO通信中的能效优化问题。针对LEO卫星高速运动导致的信道动态性和传统迭代算法计算复杂度高的问题,作者结合Dinkelbach变换和加权最小均方误差(WMMSE)优化框架,利用GNN建模多用户干扰关系,并通过泰勒近似降低矩阵求逆开销。实验结果表明,该方法在保持接近传统优化性能的同时显著降
今日候选池 89 篇,硬过滤 + LLM 打分后通过评估 13 篇,精选 Top-10,另列 3 篇速览
Hi,大家好,我是半亩花海。现对领域内一篇SCI一区TOP期刊论文进行阅读,文献记录如下。本文提出了一种基于残差卷积与Transformer网络(R-TNet)和特征迁移策略的锂离子电池健康状态(SOH)估计方法。针对现有方法对固定充电区间和长度的依赖问题,该方法创新性地实现了任意长度随机充电片段的SOH估计。通过残差卷积网络作为嵌入层和交叉注意力机制,有效整合了工况信息与老化特征。实验结果表明,
本文介绍了如何在星图GPU平台上自动化部署bitnet-b1.58-2B-4T-gguf极致高效、原生1.58-bit量化开源大模型,打造科研论文阅读助手。该模型特别适合学术场景,能自动生成论文摘要、解读图表数据并解释专业术语,显著提升科研人员文献阅读效率。
所有层都缺乏将 Harness 暴露为可替换实体的机制,也缺乏闭环改进机制。Claude Code 的动态工作流允许模型在运行时生成脚本,但仅限于单次会话,缺乏持久化优化和跨会话进化HarnessX 通过 RL 与符号 Harness 进化之间的“操作镜像”实例化了这一范式。AEGIS 是进化 Harness 的系统。。单纯进化 Harness 会遇到“脚手架天花板”(模型能力不足无法利用更好的
本文提出了一种名为 RoboFactory 的框架和基准测试,利用大模型生成“逻辑、空间、时间”三重限制条件,来自动化地生成高质量的多机器人协作训练数据,并探索了如何训练多机器人模仿学习模型。
谷歌DeepMind与浙江大学团队近日发布的多模态大模型Archon,突破了数字人领域长期存在的"拼凑式"技术瓶颈。该模型通过三大创新实现了任意模态间的高保真转换:1)将视频分解为"语义骨架"和"画质渲染"两阶段处理,使Token数量减少75%;2)引入"模态内省"机制,通过中间模态过渡提升生成稳定性;3)基于统一架构实现72种子任务的协同训练,支持台词修改、性别转换等复杂编辑。实验显示其性能超越
论文测试了 Qwen-3、Llama-3.1、GPT-4o、GPT-5.1、Gemini-3 和 Claude-4.5。它关注一个很现实的问题:LLM 智能体已经不只是聊天机器人,而是能调用工具、读网页、写邮件、用日历、保存记忆的“数字助手”。因为现实攻击往往不是一锤子买卖,而是像“温水煮青蛙”,通过多轮用户、智能体、环境交互,把危险目标拆开、伪装、累积,最终让智能体执行原本不该执行的操作。它包含
提供选题建议、功能需求设计、任务书与开题报告撰写、项目中期检查与论文辅导等服务。无论是代码实现、论文降重、答辩PPT制作,还是一对一的代码讲解,我们都能提供专业的帮助,助力你的学习与项目提升
2023年以来,生成式AI和大语言模型(LLM)正深刻重塑企业级软件市场,尤其冲击传统业务管理门户(ERP/CRM/OA等)。这些系统长期受限于结构化流程和信息孤岛,而AI技术正推动其从底层架构到交互模式的全面革新:架构上向“智能系统”转型,集成API和微服务;交互上从GUI转向CUI,实现“意图驱动”的智能助手模式。未来,传统门户将进化为主动化、个性化的“企业智慧中枢”,助力企业在AI驱动的数字
本文提出了一种基于随机几何的下行卫星网络覆盖概率分析方法。作者将卫星和用户分别建模为同心球面上的泊松点过程,通过球面几何推导典型用户可见卫星区域(球冠)内的距离分布和干扰特性。在考虑Nakagami-m衰落信道条件下,建立了覆盖概率的解析表达式,并分析了卫星密度、高度等参数对网络性能的影响。研究结果表明,增加卫星密度并不总是提高覆盖概率,存在最优密度平衡信号增强与干扰增加。该方法避免了传统星座仿真
MinerU Zotero Reader是一个集成Zotero、MinerU和Codex的工具,可将论文PDF一键转换为三种阅读笔记(快读/精读/写作级精读)。它解决了传统PDF阅读的痛点:通过MinerU精准解析PDF为Markdown,再由Codex生成结构化笔记并自动挂回Zotero原文献。快读模式适合筛选文献,精读模式生成研究方法笔记,写作级精读则分析论文结构与可复用表达。安装后用户可在Z
这篇论文面向人工光植物工厂智能化、无人化生产需求,研发大语言模型驱动的专用 AI 智能代理系统垂元,融合大模型语义理解、逻辑推理能力与深度学习特征提取、预测建模优势,依托检索增强生成技术植入完整植物工厂专业知识库,有效缓解模型幻觉问题。系统采用分层递进架构搭建,底层联合农业多模态大模型与通用大模型完成多模态信息处理,通过思维链提示、LoRA 轻量化微调优化专业场景推理效果;兼容环境、长势、设备能耗
不用敲一行代码,帮你完整搭建Java知识体系,搞懂底层逻辑,建立编程思维,为后续实操、项目开发、面试打下扎实基础。1. 最稳的后端语言:绝大多数企业后台、管理系统、小程序服务、电商平台都是Java开发。结果就是:敲得懂、看不懂、不会用、换个需求直接懵。所有Java进阶知识:继承、多态、封装、接口,全部是为了规范面向对象设计。Java所有知识点、所有项目、所有企业开发,全部基于这4套思维。适合:计算
论文测试了 LLaMA3-8B、Qwen-2.5-7B、DeepSeek-V3、DeepSeek-R1、GPT-3.5-Turbo 和 GPT-4o-mini,并用规则评估、LLaMA Judge、GPT Judge 三类方式评估。它不需要访问模型参数,也不依赖梯度,只把有害自然语言请求转换成一阶逻辑表达式,再加上形式语义学语境和具体化指令,让模型把逻辑表达式重新解释成可执行内容。该论文构建了覆盖
Zotero作为开源文献管理工具,广泛应用于学术研究,但其智能化功能有限。而DeepSeek作为大语言模型,擅长文本分析、摘要生成和知识推理。通过硅基流动(SiFlow)平台调用DeepSeek API,可为Zotero注入AI能力,实现以下场景:文献智能摘要:自动生成文献核心观点摘要,快速筛选关键内容;智能标签分类:根据文献主题自动打标签,优化文献库管理;跨文献关联分析:发现不同文献间的潜在关联
饶鸿洲同学@weixin_42161680 分享了Conversational Automated Program Repair.CoRR abs/2301.13246(2023)《对话式自动程序修复》分享时的PPT简洁大方,重点突出对流程图介绍清晰,没看论文也能理解论文:https://arxiv.org/abs/2301.13246代码:https://github.com/ASSERT-KT
本文主要介绍了如何利用蓝耘元生代MaaS平台接入GLM-5.1模型,并通过QClaw工具构建科研辅助流程,完成LLM Agent领域的文献综述工作。文章从模型选型出发,详细分析了GLM-5.1的性能指标(吞吐、延迟、可靠性)及价格优势,特别强调了其长上下文、工具调用和多轮任务处理能力对文献整理任务重要性。随后说明了将蓝耘元生代API接入QClaw的具体步骤,重点指出OpenAI兼容协议的关键作用。
llm-for-zotero插件所需要的skills和markdown解码文件的翻译方案:
有chatgpt Gemini等各大ai写论文的可以找我。
论文阅读
——论文阅读
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net