是Yu欸个人主页

@wtyuong

是Yu欸

2022-10-24 18:40:10 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【网安AIGC专题10.11】①代码大模型的应用：检测、修复②其安全性研究：模型窃取攻击（API和网页接口）数据窃取攻击对抗攻击（用途：漏洞隐藏）后门攻击（加触发器+标签翻转）

`大型模型输出格式不受控制`的情况，一些可能的解决方法：1. 输出处理：- **后处理和过滤：** 可以通过编写自定义的后处理代码来筛选和处理大型模型的输出。这可能包括解析输出以识别关键信息、删除不必要的内容、转换输出格式，以及对输出进行筛选和排序。- **数据存储：** 将输出存储到数据库中（可以理解为，输出转换为结构化数据，而不是自由的文本），以便按需检索和查询。- **数据过滤和清理：**

#自然语言处理 #人工智能 #论文阅读 +2

【网安AIGC专题】46篇前沿代码大模型论文、24篇论文阅读笔记汇总

本文为邹德清教授的《网络安全专题》课堂笔记系列的文章，本次专题主题为大模型。本系列文章不仅涵盖了46篇关于前沿代码大模型的论文，还包含了24篇深度论文阅读笔记，全面覆盖了代码生成、漏洞检测、程序修复、生成测试等多个应用方向，深刻展示了这些技术如何在网络安全领域中起到革命性作用。同时，本系列还细致地介绍了大模型技术的基础架构、增强策略、关键数据集，以及与网络安全紧密相关的模型安全问题。本篇博客旨在整

#论文阅读 #网络安全 #学习 +1

17ASAP如何更好地改进少样本提示：在LLMs的prompt中添加语义信息，来提高代码摘要生成+代码补全任务的性能。CodeSearchNet数据集【网安AIGC专题11.7】

感觉未来无论是日常Prompt或者论文都有可能会用到文档完备的代码更容易维护，例如函数摘要头。随着项目的发展，摘要注释可能会过时。自动代码摘要生成应运而生，已经取得了相当大的进展。最初，基于模板的方法很流行，但创建具有良好覆盖率的模板列表很具有挑战性。后来，研究人员专注于基于检索(IR)的方法，主要是基于相似性的度量检索现有代码(带有摘要)。但是，只有在可用池中可以找到类似的代码注释对时，这种有前

#AIGC #自然语言处理 #语言模型 +1

【网安AIGC专题10.19】论文4：大模型（CODEX 、CodeGen 、INCODER ）+自动生成代码评估：改进自动化测试方法、创建测试输入生成器、探索新的评估数据集扩充方法

介绍了EvalPlus，一个严格的程序合成评估框架，以自动化测试生成为驱动。EvalPlus将基于LLM（使用ChatGPT进行提示）和基于变异的输入生成相结合，以获得多样化的测试输入集，以准确评估LLM生成代码的功能正确性。创建了HUMANEVAL+，通过增加高质量和自动生成的测试输入来扩展流行的HUMANEVAL基准测试。通过测试套件缩减，创建了比HUMANEVAL+小47倍的HUMANEVA

#安全 #论文阅读 #nlp +2

香橙派 AIpro 开发板 AI 应用部署测评

在人工智能和物联网技术日益成熟的今天，边缘计算设备因其在数据处理和实时性方面的优势而受到广泛关注。香橙派 AIpro（OrangePi AIpro）开发板以其出色的性能和丰富的应用场景，成为开发者探索 AI 应用部署的理想选择。

14Cosco跨语言代码搜索代码： (a) 训练阶段相关程度的对比学习对源代码(查询+目标代码)和动态运行信息进行编码 (b) 在线查询嵌入与搜索：不必计算相似性【网安专题11.8】

► 本文提出了一种新颖的由代码到代码搜索模型，称为 COSCO。该方法利用通过以语义相似度得分 (SSS) 的形式对运行时行为进行编码，从而来增强LLM性能表现。与在训练过程中仅考虑正样本的代码搜索不同，COSCO 模型既最小化相似样本之间的距离，又最大化不相似样本之间的距离，有效降低了模型时间复杂度。► 在跨语言代码搜索任务中对COSCO模型进行了充分验证，即使用 Java 查询搜索 Pytho

#论文阅读 #全文检索 #bert +1

到底了