
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
今天使用BERT模型对短文本进行分类,整理好的短文本放在了Excel中,准备使用Excel对短文本进行打标签、数据清洗。打标签我使用打标签的方法很简单,由于短文本的辨识度比较高,所以我使用了如下Excel公式组合对短文本打标签(因为数据的私密性,所以我只讲方法,数据采用虚拟数据):如果A1单元格同时包含字符串“大”、“小”、“20”,则标签打成“有”,否则打成“无”=IF(AND(...
本文做了一个识别简单验证码的小例子,具体思路如下:使用captcha类库随机生成4位纯数字或数字、大小写组合的验证码;以第一步生成的验证码为训练数据,对3层卷积、2层全连接模型进行训练;当训练的正确率达到规定的阈值时,保存模型,并停止训练。说明:若验证码为4位纯数字,则模型要完成的分类数为4*10=40分类任务;若验证码为4为数字+大写+小写组成,则为4*(10+26+26)...
近期在调试深度学习相关的代码时,经常隔三差五遇到range()、np.arange()、np.linspace()、np.logspace()一系列的函数,每次遇到后,当时貌似理解了,但是过段时间又忘了,并且这几个函数看起来还长的差不多,虽然实现的功能看起来挺相似,但是他们之间还是有很多细微的区别。毫不夸张的说,每次见到,每次好像都懂,但是呢,每次貌似又不确定,每次还是懵的、大脑还是混淆的。...
如下是官网对tf.reset_default_graph()函数描述的翻译:tf.reset_default_graph函数用于清除默认图形堆栈并重置全局默认图形。注意:默认图形是当前线程的一个属性。该tf.reset_default_graph函数只适用于当前线程。当一个tf.Session或者tf.InteractiveSession激活时调用这个函数会导致未定义的行为。调用此函数后...
深度学习技术发展到今天,在图像、语音、自然语言处理(natural language processing,NLP)领域有很多的应用。由于人类语言的多样性、多意性,使得NLP的难度成倍增加。例如由相同的三个字形成的组合“不怕辣”、“辣不怕”、“怕不辣”、“怕辣不”表达了不同的含义。有些话还要结合当时的语境进行理解,否则得到的结果谬之千里,比如:“中国乒乓球谁也打不过”、“中国足球谁也打不过”。本文
CNN应用在图片分类的场景中较多,可能给大家一个思维定势----CNN貌似只能应用在图片场景,其实CNN也可对文本进行分类。卷积只是特征提取的一种方式,并不是只能处理图像,使用卷积只要能提取特征即可。一、卷积应用在文本分类的思路下图为卷积对文本分类的整体思路:文本分词-->映射成向量:把文本(字符串)转换成数值(对文本进行编码),上图使用7*5的矩阵存储每一句话的编码...
目的本文使用Python的sklearn类库,基于对机器学习线性回归算法的理论学习,利用sklearn中集成的波士顿房价数据,以此来对线性回归的理论知识进行一次实践总结。本文不以预测的准确率为目的,只是简单的对机器学习的线性回归等理论知识进行一次实践总结,以此来体验下sklearn类库的使用方法。美国波士顿房价的数据集是sklearn里面默认的数据集,sklearn内置的数据集都位于d...
random.seed(0)作用:使得随机数据可预测,即只要seed的值一样,后续生成的随机数都一样。一、不设置seed()import randomlist = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]a = random.sample(list, 5) # 从list中随机获取5个元素,作为一个片段返回print(a)print(list, '\n'...
TensorFlow中,想要维度增加一维,可以使用tf.expand_dims(input, dim, name=None)函数。当然,我们常用tf.reshape(input, shape=[])也可以达到相同效果,但是有些时候在构建图的过程中,placeholder没有被feed具体的值,这时就会包下面的错误:TypeError: Expected binary or unicode stri
如下是官网对tf.reset_default_graph()函数描述的翻译:tf.reset_default_graph函数用于清除默认图形堆栈并重置全局默认图形。注意:默认图形是当前线程的一个属性。该tf.reset_default_graph函数只适用于当前线程。当一个tf.Session或者tf.InteractiveSession激活时调用这个函数会导致未定义的行为。调用此函数后...







