logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM多智能体综述论文阅读 LLM-Based Multi-Agent Systems for Software Engineering:Literature Review, Vision..(2)

本文提出LMA在软件工程领域的两大研究方向:提升单体智能体能力和优化多智能体协同。对于单体智能体,通过"角色识别-能力评估-专项强化"三阶段方法,将通用LLM培养为专业SE角色代理;同时提出面向智能体的编程范式(AOP)来优化提示语言设计。在多智能体协同方面,重点解决任务分配、性能评估、系统扩展等关键问题,包括建立协作基准、设计分层架构、引入工业管理机制等。最终目标是构建可胜任

文章图片
#论文阅读#软件工程
LLM多智能体综述论文阅读 LLM-Based Multi-Agent Systems for Software Engineering:Literature Review, Vision..(1)

该论文系统梳理了基于大语言模型的多智能体系统(LLM-Based MAS)在软件工程中的应用。研究覆盖需求工程、代码生成、质量保证和维护等全生命周期,提出由编排平台(含协作模型、通信机制、规划学习方式)和LLM智能体(预定义/动态、同质/异质)组成的框架体系。通过DBLP文献检索和滚雪球方法收集案例,重点分析ChatDev等典型系统在端到端开发中的表现,发现其虽能完成贪吃蛇等游戏开发,但存在可重复

#论文阅读
大模型论文研读 WHEN LLMS MEET CYBERSECURITY: A SYSTEMATICLITERATURE REVIEW(1)

这篇综述论文探讨了大模型(LLMs)在网络安全领域的应用,涵盖300+篇论文、25个模型和10个应用场景。文章主要研究三个问题:网络安全领域LLMs的构建、应用及面临的挑战。首先介绍了开源和闭源LLMs的特点,强调代码类LLM更适合安全任务。随后详细分析了LLMs在威胁情报、漏洞检测、恶意软件分析等10个安全场景的应用。论文还系统阐述了构建网络安全领域LLM的方法:从基础模型选择、评估指标(安全知

文章图片
#网络安全#论文阅读
大模型Agent的论文研读:REACT:SYNERGIZING REASONING AND ACTING INLANGUAGE MODELS

本文阅读了ReAct的论文。在HotpotQA和FEVER任务中,ReAct通过结合推理(Thought)和外部检索(Action/Observation),显著优于仅依赖内部推理的CoT和仅依赖外部检索的Act方法。实验表明,ReAct+CoT-SC混合策略表现最佳,能有效平衡推理和检索。在决策任务(ALFWorld和WebShop)中,ReAct通过目标分解和环境跟踪,成功率达到71%,优于仅

#人工智能#论文阅读
到底了