科研小站个人主页

@Frank330

科研小站

2023-01-03 19:46:13 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

完整实现利用keras训练自己的图片数据集

本实验可以实现使用卷积神经网络对自己的数据集（图片）进行训练并得出训练时的准确率与loss图，并利用测试集得到混淆矩阵、ROC曲线图和AUC。编程环境为python3.7.4代码文件结构如下：Dataset文件夹用来存放数据集Log文件夹用来存放准确率和loss曲线图Model文件夹用来存放训练好的卷积神经网络模型，训练好后以后使用可以直接调用模型，不必每次都训练Main为主程序Dataset文件

#tensorflow #深度学习

机器学习中数据预处理的几种方法

由于实际收集到的机器学习数据集不可避免的会存在数据缺、数据集不平衡和数据集中各类数据非同一量级等情况，对缺失数据进行补全和对异常数据进行清洗、均衡化处理防止类别不平衡和数据标准化处理对于机器学习模型至关重要。1数据补全方法有效地恢复缺失的数据是进行机器学习建模的重要前期准备工作。一方面可使得数据更完整，便于后续进一步的分析研究，另一方面，数据补全本身就是对信息进行挖掘的一种方式。常见的数据补全方法

#机器学习 #深度学习 #python

Word2vec工作原理

1 词向量人类的语言在计算机中是无法直接被识别的，只能换算成二进制代码组成的机器语言计算机才能识别，并对其进行相关操作。因此要实现对语言文本的处理，首要条件就是对文本建立模型以使得机器能够识别处理。1986年，Hinton首次提出了分布式表达（Distributed Representation，DR）概念，简称词向量（Word Embedding）[30]。词向量是将大量的文本集中进行训练并统计

#自然语言处理 #算法

到底了