
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
基于mindspore的项目
是网络最终预测的结果,也就是“可能值”,因为网络可能预测正确也可能错误Anchor box被称作预选框,anchor的机制会更复杂一些,有许多帖子来专门讲解这个。总的来说就是在图像上会按照一定的规律放置一些anchor,网络会学习anchor相对于ground truth的偏移量,我们可以把anchor看作bounding box的“爷爷”,anchor+/-/×/÷偏移量所得到的框是boundi

OCR文字识别——解码方法
在Decoder解码过程中,第一个输入字符为<start>,然后不断将前一个时刻的输出作为下一个时刻的输入,循环解码,直到输出<stop>字符为止。,然后除以T,就能得到第k个字符出现的概率分布(记作�¯�),做相同计算,可以求出所有字符的概率分布,最后和label字符的概率分布计算交叉熵优化网络。对每一列1xn进行softmax得到概率最大的字符,得到的最终序列需要去除连续的重复字符,比如最终得

到底了








