logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于mindspore的项目

是网络最终预测的结果,也就是“可能值”,因为网络可能预测正确也可能错误Anchor box被称作预选框,anchor的机制会更复杂一些,有许多帖子来专门讲解这个。总的来说就是在图像上会按照一定的规律放置一些anchor,网络会学习anchor相对于ground truth的偏移量,我们可以把anchor看作bounding box的“爷爷”,anchor+/-/×/÷偏移量所得到的框是boundi

文章图片
#python
OCR文字识别——解码方法

在Decoder解码过程中,第一个输入字符为<start>,然后不断将前一个时刻的输出作为下一个时刻的输入,循环解码,直到输出<stop>字符为止。,然后除以T,就能得到第k个字符出现的概率分布(记作�¯�),做相同计算,可以求出所有字符的概率分布,最后和label字符的概率分布计算交叉熵优化网络。对每一列1xn进行softmax得到概率最大的字符,得到的最终序列需要去除连续的重复字符,比如最终得

文章图片
全连接层的作用

而卷积神经网络中conv+relu(早期为sigmoid)+pooling(以下称三剑客)的组合,不仅可以替代手工设计特征算子的繁琐,而且局部感受野+权值共享的设计思想也能避免全连接网络中的种种弊端。此时人们将三剑客的组合视为特征提取的过程,如果按照早期人们特征提取+分类的设计思路,那么分类使用全连接的设计方式,就可以刚好实现了一个end-to-end的架构,也即早起卷积神经网络的原型。在实际使用

文章图片
#深度学习#python#cnn
到底了