logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【频域深度学习】Learning in the Frequency Domain

引言我们应该都学习过信号与系统,知道信号可以分为时域、空间域以及频域等等。显然一般的深度学习方法,以图像为例,模型的输入为图像本身,属于空间域信息,那么我们是否可以利用频域信息来进行图像处理呢?转换为频域最常见的是通过傅里叶变换从时域或者空间域转换到频域。傅里叶变换将信号信息转换成每个成分频率上的幅度和相位。第一篇用CNN在频域(DCT系数)而不是空域(RGB)上直接学习的文章是On using

#计算机视觉#机器学习#算法 +1
深入浅出语言模型(一)——语言模型及其有趣的应用

引言词向量模型应该是任何一个NLP工程师都应该掌握的基础。还记得17年刚在实验室实习开始接触时,大家都一直在用word2vec。到了18年在公司实习时,实验大多基于glove模型。到了现在Bert大热,各种基于Bert的词向量模型层出不穷,在各个任务各显神威。最近由系统的学习了下词向量模型,发现其实每个词向量背后都蕴藏着很直观的思想或者很优美的数学推理,我相信对我们现在一些任务都会有启发。在这里记

#机器学习#人工智能#自然语言处理
谈一谈在OCR/场景文本识别中的对抗攻击

引言目前对抗攻击在计算机视觉中如火如荼,作为计算机视觉的一个子领域OCR,文本识别和文本检测领域中对抗攻击的任务并不多,其中文本检测可以说是一种目标检测的任务,所以目标检测的攻击方法可以直接应用在文本检测中;文本识别是一种序列分类的任务和很多图像分类任务不同,所以攻击方法不能直接迁移,下面我们对三篇论文来看一看他们的攻击思路。Adaptive Adversarial Attack on Sce..

#神经网络#大数据#深度学习 +1
Pytorch的坑之 为什么模型参数和输入不变,输出结果却变了(BN的坑)

引言不知道小伙伴使用pytorch时是否遇到了下面的情况:我们加载训练好的参数,然后输入经过网络,但是不经过梯度下降训练,也就是说模型的参数没有更改,这是我们仍然会发现我们输出的指标(例如准确率)下降。现象最近跑的一个程序,加载好预训练模型checkpoint = load_checkpoint(args.resume)model.load_state_dict(checkpoint['...

#神经网络#深度学习#人工智能 +1
由浅入深尝试图书分类任务实战(特征工程+GBDT、机器学习模型、深度学习模型)

引言在本项目中,我们主要来解决文本单标签的任务。数据源来自于京东电商, 任务是基于图书的相关描述和图书的封面图片,自动给一个图书做类目的 分类。这种任务也叫作多模态分类。在这个实战中,我掌握学习到以下的代码实践:文本特征提取:任何建模环节都需要特征提取的过程,你将会学到如何使用 tfidf、wor2vec、FastText 等技术来设计文本特征。图片特征提取:由于项目是多模态分类,图片数据也是输入

#nlp#机器学习#人工智能 +2
到底了