logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于LDA主题模型和SVM的文本分类

用LDA模型抽取文本特征,再用线性SVM分类,发现效果很差,F1=0.654。Precision:0.680,Recall:0.649,F1:0.654RandomForestClassifier的表现也比较差:Precision:0.680,Recall:0.668,F1:0.670而随便用一个深度学习模型(textCNN,LSTM+Attention)都能达到0.95+的F1,而且还...

#python#深度学习#nlp +2
CNN卷积神经网络的卷积层、池化层的输出维度计算公式

卷积层Conv的输入:高为h、宽为w,卷积核的长宽均为kernel,填充为pad,步长为Stride(长宽可不同,分别计算即可),则卷积层的输出维度为:其中上开下闭开中括号表示向下取整。MaxPooling层的过滤器长宽设为kernel*kernel,则池化层的输出维度也适用于上述公司计算。具体计算可以AlexNet为例。...

#神经网络#计算机视觉#动态规划
基于Hugging Face的transformers包的微调模型训练

transformers API参考链接:https://huggingface.co/docs/transformers/v4.21.2/en/trainingtrain.pyfrom datasets import load_datasetfrom transformers import AutoTokenizer,AutoConfigfrom transformers impor...

#python#深度学习#机器学习 +2
泰国地址书写的一般格式

泰国地址的书写格式跟西方国家类似,先写小地址,后写大地址,可分成7级的书写格式一般为:1、地块 / 楼栋 编号 --泰国人少,不像中国到处是高楼大厦,没有小区的概念,所有一般独栋小楼比较多。地块上2、村 [名称] 编号 --村(Village,泰国称之为Moo、Murban),一般郊区或乡村的地址才会写上村这一级,名称可省略。3、巷子 [名称]编号 -- 巷子(Alley,泰国称之为Soi)一..

#其他
中文的csv文件的编码改成utf-8的方法

直奔主题:把包含中文的csv文件的编码改成utf-8的方法:https://stackoverflow.com/questions/191359/how-to-convert-a-file-to-utf-8-in-python啰嗦几句:在用pandas读取hive导出的csv文件时,经常会遇到类似UnicodeDecodeError: 'gbk' codec can't decode by...

#python#unity
OpenMP求完数

源代码:1 #include "stdafx.h"//必须写在首行,因为其前面的include都会被忽略2 #include "omp.h"3 #include <Windows.h>4 #include "time.h"5 #include <iostream>6 #include <set>7 using nam...

#java#python#c++ +2
到底了