logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

[论文阅读] 人工智能 + 软件工程 | Call Me Maybe:用图神经网络增强JavaScript调用图构建

本文介绍了GRAPHIA——一种基于图神经网络的JavaScript调用图增强方法。面对传统工具在动态语言中召回率低的问题,GRAPHIA通过构建包含语法和语义边的程序图,利用GNN捕捉长距离关系,并从不完美的静态/动态数据中学习。实验证明,其能将42%的未解析调用点的正确目标列为top1,72%列入前5,为JavaScript静态分析提供了关键技术突破。该研究首次展示了GNN在整体程序表示中的应

文章图片
#人工智能#论文阅读#软件工程
[论文阅读] 人工智能 + 软件工程 | 探秘LLM软件代理:从黑箱决策到透明轨迹分析

本文介绍了一项关于LLM软件代理决策轨迹的研究。研究者通过分析RepairAgent、AutoCodeRover和OpenHands的120条轨迹,揭示了成功与失败代理的行为模式,发现测试驱动代理虽更严谨但成本更高,而高效代理需平衡探索与修复。研究为代理设计提供了调优策略,并开放了数据集以支持后续研究。

文章图片
#论文阅读#人工智能#软件工程
[论文阅读] 人工智能 + 软件工程 | USEagent:迈向统一的AI软件工程师

本文提出了统一软件工程代理(USEagent),旨在通过整合多种软件工程任务能力(如编码、测试、补丁生成),构建可自主编排工作流的AI软件工程师雏形。研究构建了包含1271个存储库级任务的统一基准USEbench,融合SWE-bench、SWT-bench等现有基准。实验表明,USEagent在PASS@1上达到33.3%的效率,高于OpenHands CodeActAgent的26.8%,在SW

文章图片
#论文阅读#人工智能#软件工程
[论文阅读] 人工智能+软件工程 | 软件工程中非代码工作的LLM能力评估

本文提出首个评估LLMs在非代码SE任务的综合基准SELU,涵盖17项任务(含分类、回归等),数据源自代码仓库等多源。通过微调22个开源LLMs、提示2个 proprietary模型及训练2个基线模型,发现中等规模纯解码器模型表现最优且跨任务方差低,而聚焦代码的预训练带来的领域适应改进有限,该研究为非代码SE工作流的模型选择提供指导并指出扩展至生成式场景等方向。

文章图片
#论文阅读#人工智能#软件工程
[论文阅读]人工智能 | CoMemo:给大视觉语言模型装个“图像记忆”

本文介绍了LVLMs在长上下文和高清图像处理中的局限性,解读了CoMemo提出的双路径架构(上下文路径+记忆路径)和RoPE-DHR位置编码方法。通过实验验证,该方案显著提升了模型在长生成、多图推理等任务的表现,为多模态模型的发展提供了新思路。

#人工智能#论文阅读#语言模型
[论文阅读] 人工智能 | 大语言模型计划生成的新范式:基于过程挖掘的技能学习

本文介绍一项将过程挖掘技术融入大语言模型(LLMs)计划生成的研究。针对现有文本规划器缺乏结构化控制流、效率低的问题,研究提出通过过程发现提取技能模型、一致性检查优化检索的框架。实验表明,该方法提升了LLMs的并行执行能力和可解释性,为复杂任务自动化提供了新思路。

#人工智能#论文阅读#语言模型
[论文阅读] 人工智能 | 用大语言模型抓虫:如何让网络协议实现与RFC规范对齐

本文介绍了RFCSCAN,一种基于大语言模型(LLM)的网络协议功能漏洞检测工具。针对传统方法难以检测代码与RFC规范的语义不一致问题,RFCSCAN通过“索引代理”为代码构建分层语义索引,再用“检测代理”按需检索代码上下文,实现精准漏洞定位。在6个真实协议中,它以81.9%的准确率发现47个漏洞,为协议安全审计提供了新思路。

#人工智能#论文阅读#语言模型
[论文阅读] 人工智能 | 用大语言模型解决软件元数据“身份谜题”:科研软件的“认脸”新方案

本文介绍了利用大语言模型(LLMs)解决科研软件元数据身份解析的研究。传统方法在处理分散、模糊的软件元数据时效率低下,而LLMs通过语义理解和多模型共识机制(“多数决”代理),实现了超89%的准确率和96.5%的自动化决策精度,大幅提升了科研软件管理的效率,为开放科研基础设施中的数据整合提供了创新方案。

#人工智能#论文阅读#语言模型
[论文阅读] 软件工程 | 量子计算如何赋能软件工程(Quantum-Based Software Engineering)

本文介绍了一篇关于量子计算在软件工程领域应用的前沿论文。文章指出,传统软件工程在测试用例选择、代码缺陷预测等方面存在效率瓶颈。论文提出量子赋能软件工程(QBSE)这一创新方向,探讨了量子搜索、优化和机器学习方法在软件测试、缺陷预测、代码分析等任务中的应用潜力,并展望了其发展未来。

#论文阅读#软件工程#量子计算
[论文阅读] 人工智能 + 软件工程 | AI 与敏捷开发的破局之路:从挫败到成功的工作坊纪实

XP2025 举办的“AI 与敏捷软件开发:从挫败到成功”工作坊汇聚了研究人员和行业从业者,旨在解决将人工智能集成到敏捷软件开发中的实际挑战与机遇。参与者通过互动环节识别出工具、治理、数据质量和关键技能差距等整合难题,经系统分析后协作制定了研究路线图,明确了包括即时解决方案和长期目标在内的可行动方向,形成了旨在促进产学研共同努力实现从识别挫败到成功实施的结构化议程。

文章图片
#论文阅读#人工智能#软件工程
    共 295 条
  • 1
  • 2
  • 3
  • 30
  • 请选择