
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
用LDA模型抽取文本特征,再用线性SVM分类,发现效果很差,F1=0.654。Precision:0.680,Recall:0.649,F1:0.654RandomForestClassifier的表现也比较差:Precision:0.680,Recall:0.668,F1:0.670而随便用一个深度学习模型(textCNN,LSTM+Attention)都能达到0.95+的F1,而且还...
卷积层Conv的输入:高为h、宽为w,卷积核的长宽均为kernel,填充为pad,步长为Stride(长宽可不同,分别计算即可),则卷积层的输出维度为:其中上开下闭开中括号表示向下取整。MaxPooling层的过滤器长宽设为kernel*kernel,则池化层的输出维度也适用于上述公司计算。具体计算可以AlexNet为例。...
transformers API参考链接:https://huggingface.co/docs/transformers/v4.21.2/en/trainingtrain.pyfrom datasets import load_datasetfrom transformers import AutoTokenizer,AutoConfigfrom transformers impor...
泰国地址的书写格式跟西方国家类似,先写小地址,后写大地址,可分成7级的书写格式一般为:1、地块 / 楼栋 编号 --泰国人少,不像中国到处是高楼大厦,没有小区的概念,所有一般独栋小楼比较多。地块上2、村 [名称] 编号 --村(Village,泰国称之为Moo、Murban),一般郊区或乡村的地址才会写上村这一级,名称可省略。3、巷子 [名称]编号 -- 巷子(Alley,泰国称之为Soi)一..
直奔主题:把包含中文的csv文件的编码改成utf-8的方法:https://stackoverflow.com/questions/191359/how-to-convert-a-file-to-utf-8-in-python啰嗦几句:在用pandas读取hive导出的csv文件时,经常会遇到类似UnicodeDecodeError: 'gbk' codec can't decode by...