logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

网络安全文章研读——基于对抗性强化学习的网络安全系统

An adversarial reinforcement learning based system for cyber security0x01 摘要提出来一种基于RL的系统,保护用户免受恶意流量的侵害。生成网络攻击生成agent和网络防御agent,基于深度神经网络环境,超越传统的ML算法,可以检测对抗样本。0x02 intro基于DNN的方案容易被对抗样本日穿。SVM和RL的方案对对抗样本检

深度强化学习笔记:策略梯度

本文是对datawhalechina.github.io的深度强化学习教程的笔记和适当精简原文地址:https://datawhalechina.github.io/easy-rl/0x01 简介强化学习中,我们面对的是一个马尔可夫决策模型。状态集合SSS、策略集合AAA和回报集合RRR是给定的,我们无法施加改动。为了获得更高的的收益,Agent只能通过选择AAA中“合适”的元素作为在给定状态之下

#机器学习
强化学习笔记:Q-learning

本文整理于datawhalechina.github.io的强化学习教程以及莫烦python强化学习教程这篇写短点吧,要是在写长的话动辄几个小时,顶不住啊QAQ0x01 简介

网络安全文章研读:用深度强化学习来逃脱机器学习的检测

0x01 太长不看版ML技术可以被用来做botnet入侵检测而且效果海星。但是现在可以用对抗性ML构造特定样本来逃脱检测,因为ML模型对扰动很敏感…这个工作提出来一个基于DRL的通用框架,通过往样本里加扰动来欺骗入侵检测系统IDS。整个过程中,IDS被攻击者当成一个黑盒模型来日,agent会根据feedback(是否被IDS识别)和动作序列a(更改包的时空特征)来更新他扔给黑盒的样本。这么做的结果

到底了