morein2008 个人主页

@hoo1990

morein2008

2022-07-08 17:24:13 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

基于LDA主题模型和SVM的文本分类

用LDA模型抽取文本特征，再用线性SVM分类，发现效果很差，F1=0.654。Precision:0.680,Recall:0.649,F1:0.654RandomForestClassifier的表现也比较差：Precision:0.680,Recall:0.668,F1:0.670而随便用一个深度学习模型(textCNN,LSTM+Attention)都能达到0.95+的F1，而且还...

#python #深度学习 #nlp +2

CNN卷积神经网络的卷积层、池化层的输出维度计算公式

卷积层Conv的输入：高为h、宽为w，卷积核的长宽均为kernel，填充为pad,步长为Stride(长宽可不同，分别计算即可)，则卷积层的输出维度为：其中上开下闭开中括号表示向下取整。MaxPooling层的过滤器长宽设为kernel*kernel，则池化层的输出维度也适用于上述公司计算。具体计算可以AlexNet为例。...

#神经网络 #计算机视觉 #动态规划

基于Hugging Face的transformers包的微调模型训练

transformers API参考链接：https://huggingface.co/docs/transformers/v4.21.2/en/trainingtrain.pyfrom datasets import load_datasetfrom transformers import AutoTokenizer,AutoConfigfrom transformers impor...

#python #深度学习 #机器学习 +2

泰国地址书写的一般格式

泰国地址的书写格式跟西方国家类似，先写小地址，后写大地址，可分成7级的书写格式一般为：1、地块 / 楼栋编号 --泰国人少，不像中国到处是高楼大厦，没有小区的概念，所有一般独栋小楼比较多。地块上2、村 [名称] 编号 --村(Village，泰国称之为Moo、Murban)，一般郊区或乡村的地址才会写上村这一级，名称可省略。3、巷子 [名称]编号 -- 巷子(Alley，泰国称之为Soi)一..

#其他

中文的csv文件的编码改成utf-8的方法

直奔主题：把包含中文的csv文件的编码改成utf-8的方法：https://stackoverflow.com/questions/191359/how-to-convert-a-file-to-utf-8-in-python啰嗦几句：在用pandas读取hive导出的csv文件时，经常会遇到类似UnicodeDecodeError: 'gbk' codec can't decode by...

#python #unity

OpenMP求完数

源代码：1 #include "stdafx.h"//必须写在首行，因为其前面的include都会被忽略2 #include "omp.h"3 #include <Windows.h>4 #include "time.h"5 #include <iostream>6 #include <set>7 using nam...

#java #python #c++ +2

到底了