logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

命名实体识别系列(三)NER实体词典的获取与使用

一些网站会直接提供实体词典,如搜狗词典;可以从结构化/半结构化数据中挖掘实体词典,例如百度百科、医学网站的Link等等;从文本中挖掘。用户可能提供一些非标准化表达,这时候就需要用到新词挖掘技术,可以参考美团搜索的新词挖掘技术:...

#自然语言处理
命名实体识别系列(一)NER任务介绍

命名实体识别系列(一)NER任务介绍前言博主为某校研究生,目前研二,经历过两段NER工作的实习,也投了一篇NER相关的论文。准备在今年(2021)开一个关于NER的系列博客,分专题由浅入深地从实践需求和学术论文等方面对NER做一个体系梳理。因个人能力和水平有限,并非该领域的资深专家,难免有不少疏漏和不妥甚至错误之处,恳请同行批评指正。注:以边学边做,边学边写的方法,对某些问题的理解会出现变化,因此

#nlp#知识图谱
Radon变换

在做老师的“表格识别课题研究”的时候,因为要用到倾斜校正,其基本原理是识别出扫描图像文件中的直线,然后计算倾斜角,在把倾斜的图像校正回来。在读论文的时候遇到了很多倾斜校正的算法,今天好好研究了一下Radon(拉冬)变换来进行直线识别的算法。能识别出直线的位置,下一步就可以简单得进行倾斜校正了查了很多资料,大概明白了RADON变换是一种原始灰度图像到(p,o)二维矩阵的映射,映射关系是灰度图像的像素

#图像处理
到底了