logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【网安AIGC专题】46篇前沿代码大模型论文、24篇论文阅读笔记汇总

本文为邹德清教授的《网络安全专题》课堂笔记系列的文章,本次专题主题为大模型。本系列文章不仅涵盖了46篇关于前沿代码大模型的论文,还包含了24篇深度论文阅读笔记,全面覆盖了代码生成、漏洞检测、程序修复、生成测试等多个应用方向,深刻展示了这些技术如何在网络安全领域中起到革命性作用。同时,本系列还细致地介绍了大模型技术的基础架构、增强策略、关键数据集,以及与网络安全紧密相关的模型安全问题。本篇博客旨在整

文章图片
#论文阅读#网络安全#学习 +1
17ASAP如何更好地改进少样本提示:在LLMs的prompt中添加语义信息,来提高代码摘要生成+代码补全任务的性能。CodeSearchNet数据集【网安AIGC专题11.7】

感觉未来无论是日常Prompt或者论文都有可能会用到文档完备的代码更容易维护,例如函数摘要头。随着项目的发展,摘要注释可能会过时。自动代码摘要生成应运而生,已经取得了相当大的进展。最初,基于模板的方法很流行,但创建具有良好覆盖率的模板列表很具有挑战性。后来,研究人员专注于基于检索(IR)的方法,主要是基于相似性的度量检索现有代码(带有摘要)。但是,只有在可用池中可以找到类似的代码注释对时,这种有前

文章图片
#AIGC#自然语言处理#语言模型 +1
【网安AIGC专题10.19】论文4:大模型(CODEX 、CodeGen 、INCODER )+自动生成代码评估:改进自动化测试方法、创建测试输入生成器、探索新的评估数据集扩充方法

介绍了EvalPlus,一个严格的程序合成评估框架,以自动化测试生成为驱动。EvalPlus将基于LLM(使用ChatGPT进行提示)和基于变异的输入生成相结合,以获得多样化的测试输入集,以准确评估LLM生成代码的功能正确性。创建了HUMANEVAL+,通过增加高质量和自动生成的测试输入来扩展流行的HUMANEVAL基准测试。通过测试套件缩减,创建了比HUMANEVAL+小47倍的HUMANEVA

文章图片
#安全#论文阅读#nlp +2
【pkuseg】由于网络策略组织下载请求,因此直接在github中下载细分领域模型medicine

用户可以使用自己的标注数据来训练专门的分词模型,进一步提升分词效果在特定应用场景中的表现。

文章图片
#github#nlp#网络 +1
香橙派 AIpro 开发板 AI 应用部署测评

在人工智能和物联网技术日益成熟的今天,边缘计算设备因其在数据处理和实时性方面的优势而受到广泛关注。香橙派 AIpro(OrangePi AIpro)开发板以其出色的性能和丰富的应用场景,成为开发者探索 AI 应用部署的理想选择。

文章图片
【GitHub】如何在github上提交PR(Pull Request) + 多个pr同时提交、互不干扰

GitHub 是全球最大的代码托管平台之一,允许开发者共享代码、协作开发,并进行版本控制。在这个平台上,Pull Request(简称 PR)是一个非常关键的功能,允许你向其他项目贡献代码。这篇博客将详尽介绍如何在 GitHub 上成功提交 PR,包括准备工作、创建 PR 的步骤,以及如何优化你的 PR 以增加被接受的可能性。

文章图片
#github
14Cosco跨语言代码搜索代码: (a) 训练阶段 相关程度的对比学习 对源代码(查询+目标代码)和动态运行信息进行编码 (b) 在线查询嵌入与搜索:不必计算相似性【网安专题11.8】

► 本文提出了一种新颖的由代码到代码搜索模型,称为 COSCO。该方法利用通过以语义相似度得分 (SSS) 的形式对运行时行为进行编码,从而来增强LLM性能表现。与在训练过程中仅考虑正样本的代码搜索不同,COSCO 模型既最小化相似样本之间的距离,又最大化不相似样本之间的距离,有效降低了模型时间复杂度。► 在跨语言代码搜索任务中对COSCO模型进行了充分验证,即使用 Java 查询搜索 Pytho

文章图片
#论文阅读#全文检索#bert +1
到底了