
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
2019/12/14首先,这个问题的提出,是当时最开始学习LSTM的时候,看到了一个博客[1],他的实施方案;其实他就是从文章[2]翻译过来的,但是自己修改了一些代码,可以看文章[2]的内容,他做出来的图像有明显的滞后性,但是文章[1]就没有;文章[1]把最后的代码给改了,就是说最后的时候,实际上是他画图的时候故意错位了。所以这里反应出来一个问题:LSTM存在滞后性。[1]中评论还说,可能是最..
20210508 -(随笔,后续有时间在对概念有了深入理解之后再进行整理)0. 引言今天不想写论文,就想起了之前关注的一个内容,机器学习的可解释性。在之前的时候,或多或少了解这个东西,发现他更多的是从特征的角度来解释,这个特征怎么影响了模型。但是我一直理解不了的就是,这个概念跟以往机器学习中的特征选择又有什么区别。今天看了一些文章之后,感觉似懂非懂;但是本质上还是没有解决这个关键疑惑。但是他们两者
20200911 -这里记录一个平时使用的脚本,免密登陆什么的。免密登陆#! /bin/bash[ ! -f /root/.ssh/id_rsa.pub ] && ssh-keygen -t rsa -P '' -f /root/.ssh/id_rsa &>/dev/nullexpect -c "spawn ssh-copy-id -i /root/.ssh/id_r
2018/10/31这个东西在学习PCA的时候遇见的,而且一直都没在统计学中遇见过。2018/11/26应该就是在分析PCA的时候,他提到了这种名词关系,这部分变量解释了80%的方差;这种说法,对我第一次听说这个东西的我看来,是很让人惊讶的。这个指标如果达到了很高,那岂不就算是对这个事务内在的规律掌握了。...
2020/04/03 -本文是对文章[1]的读后感,详细信息请参考原文。本文是对恶意样本进行分类,包括病毒、木马、蠕虫等。对于软件的处理,是通过沙箱运行,得到软件运行的api调用序列,然后利用CNN来实现最后的分类。我看了一下他的源代码,第一层是一个embedding,其实我就是对这个东西不是非常理解。说白了, 他的这个工作就是一个文本分类的过程,文本是某软件的系统调用执行序列。然后他利用...
2018/12/27无论看到论文也好,文章也好,都提到了深度学习是一种无特征的学习方法。因为大部分情况下,他们的范例都是以图像为基础的,所以我并不是非常理解。图1 手势特征[1]不过今天看了kaggle上的一个教程[1],文章中并没有直接说明,但看的过程中,有点明白。无特征的意义,是指他将原始数据直接输入到算法中,让算法(或模型)根据标记好的数据,来实现相应的权值的选择。如果可...
20220924 -在以往的学习中,通常聚类行为都是应用于高维数据,或者利用2维数据,最为实验性验证过程。但是最近遇到了一项任务,对某数据处理的结果进行处理,处理完之后,数据只有一维,如果数据内容比较简单,那么用直方图绘制之后,可以发现只有两个簇,而且距离也比较远。当然,这种情况比较少。那么这里其实引发一个问题,怎么来划分开两个类别,这也是我思考的问题。一开始的时候,我也不太理解,就想着利用聚类的
2020/06/17 -数据可视化,同时可以交互,在windows下如果使用matplotlib绘图,可以进行拉伸,来将显示图像。这种算是属于简单的交互式可视化吧。我之前就有一个想法, 可以跟网页上的标签一样,鼠标悬停在点上,可以显示数据,同时可以进行拉伸等操作。但是没有找到合适的库。昨天和今天看了两个关于自然语言处理的文章[1][2](其实我看到过不少word2vec的文章,他们在最后都会...
2020/03/22 -本片论文是基于大数据环境对Web检测的一个范例,代码的话,我简单看了一下, 有些没看懂,但是这个范例很又启发性。模型计算部分参数泛化,这个就跟我之前看到过的那篇《机器学习检测外联HTTP流量》一样,按照不同字符类型,替换为统一的字符。大数据框架训练过程是一个批处理过程,而实时在线检测又是一个流处理过程。典型的批+流式框架如Cisco的Opensoc使用开...







