
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
自然语言处理的数据预处理过程
经过毕设一段时间的学习,我对自然语言处理领域数据预处理部分有了一点浅显的理解。自然语言处理领域实现过程中需要将文本转化为深度学习模型的向量输入。因此重要的是如何将文本转化为模型需要的向量输入格式。我目前将转化方法分为两种:一个是Bert预训练模型的输入,另一个是一般深度学习模型(如TextCNN)。其实前者也可以归属于后者,只是Bert预训练模型有专门的方法对文本数据进行处理,所以操作方面有所不同
到底了