logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【网安AIGC专题10.11】①代码大模型的应用:检测、修复②其安全性研究:模型窃取攻击(API和网页接口) 数据窃取攻击 对抗攻击(用途:漏洞隐藏) 后门攻击(加触发器+标签翻转)

`大型模型输出格式不受控制`的情况,一些可能的解决方法:1. 输出处理:- **后处理和过滤:** 可以通过编写自定义的后处理代码来筛选和处理大型模型的输出。这可能包括解析输出以识别关键信息、删除不必要的内容、转换输出格式,以及对输出进行筛选和排序。- **数据存储:** 将输出存储到数据库中(可以理解为,输出转换为结构化数据,而不是自由的文本),以便按需检索和查询。- **数据过滤和清理:**

文章图片
#自然语言处理#人工智能#论文阅读 +2
【网安AIGC专题】46篇前沿代码大模型论文、24篇论文阅读笔记汇总

本文为邹德清教授的《网络安全专题》课堂笔记系列的文章,本次专题主题为大模型。本系列文章不仅涵盖了46篇关于前沿代码大模型的论文,还包含了24篇深度论文阅读笔记,全面覆盖了代码生成、漏洞检测、程序修复、生成测试等多个应用方向,深刻展示了这些技术如何在网络安全领域中起到革命性作用。同时,本系列还细致地介绍了大模型技术的基础架构、增强策略、关键数据集,以及与网络安全紧密相关的模型安全问题。本篇博客旨在整

文章图片
#论文阅读#网络安全#学习 +1
17ASAP如何更好地改进少样本提示:在LLMs的prompt中添加语义信息,来提高代码摘要生成+代码补全任务的性能。CodeSearchNet数据集【网安AIGC专题11.7】

感觉未来无论是日常Prompt或者论文都有可能会用到文档完备的代码更容易维护,例如函数摘要头。随着项目的发展,摘要注释可能会过时。自动代码摘要生成应运而生,已经取得了相当大的进展。最初,基于模板的方法很流行,但创建具有良好覆盖率的模板列表很具有挑战性。后来,研究人员专注于基于检索(IR)的方法,主要是基于相似性的度量检索现有代码(带有摘要)。但是,只有在可用池中可以找到类似的代码注释对时,这种有前

文章图片
#AIGC#自然语言处理#语言模型 +1
【网安AIGC专题10.19】论文4:大模型(CODEX 、CodeGen 、INCODER )+自动生成代码评估:改进自动化测试方法、创建测试输入生成器、探索新的评估数据集扩充方法

介绍了EvalPlus,一个严格的程序合成评估框架,以自动化测试生成为驱动。EvalPlus将基于LLM(使用ChatGPT进行提示)和基于变异的输入生成相结合,以获得多样化的测试输入集,以准确评估LLM生成代码的功能正确性。创建了HUMANEVAL+,通过增加高质量和自动生成的测试输入来扩展流行的HUMANEVAL基准测试。通过测试套件缩减,创建了比HUMANEVAL+小47倍的HUMANEVA

文章图片
#安全#论文阅读#nlp +2
香橙派 AIpro 开发板 AI 应用部署测评

在人工智能和物联网技术日益成熟的今天,边缘计算设备因其在数据处理和实时性方面的优势而受到广泛关注。香橙派 AIpro(OrangePi AIpro)开发板以其出色的性能和丰富的应用场景,成为开发者探索 AI 应用部署的理想选择。

文章图片
14Cosco跨语言代码搜索代码: (a) 训练阶段 相关程度的对比学习 对源代码(查询+目标代码)和动态运行信息进行编码 (b) 在线查询嵌入与搜索:不必计算相似性【网安专题11.8】

► 本文提出了一种新颖的由代码到代码搜索模型,称为 COSCO。该方法利用通过以语义相似度得分 (SSS) 的形式对运行时行为进行编码,从而来增强LLM性能表现。与在训练过程中仅考虑正样本的代码搜索不同,COSCO 模型既最小化相似样本之间的距离,又最大化不相似样本之间的距离,有效降低了模型时间复杂度。► 在跨语言代码搜索任务中对COSCO模型进行了充分验证,即使用 Java 查询搜索 Pytho

文章图片
#论文阅读#全文检索#bert +1
到底了