logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Jupyter Notebook对数据集进行数据分析 数据统计(含:样本数量/样本长度/样本长度分布图/示例样本打印)

以下内容可直接以写入.ipynb文件的形式,放入服务器上任意已准备好数据集的文件夹下:导入模块import osimport jsonimport refrom collections import defaultdict绘图函数def draw(dic): #输入样本数量统计字典import numpy as npimport matplotlib.pyplot as pltfrom matpl

#jupyter#数据分析
jupyter快速实现单标签及多标签多分类的文本分类BERT模型

jupyter快速实现单标签及多标签多分类的文本分类BERT模型。

文章图片
#jupyter#分类#bert +1
python:向word中写入文本和图片

安装python包pip install python-docximport python包from docx import Documentfrom docx.shared import Inches#eg:doc=Document() #开头:声明一个doc文件...doc.save('sentimentCasedStudy.docx') #结尾:定义文件名并保存实例:向doc中写入文本和图片

#python
百面机器学习阅读笔记(一):模型评估

阅读《百面机器学习》第二章部分内容。

#算法#python#机器学习
机器学习实践:中文文本预处理(词袋模型/TF-IDF)

目标:为了实现利用贝叶斯模型进行新闻文本主题分类,对中文文本进行预处理。步骤1.准备2.创建停用词词典3.定义Document类(可省)4.序列化标签 载入数据5.创建词典6.文本向量化方法一:one-hot 表达方法方法二:词袋模型方法三:TF-IDF7.打乱数据集8.划分训练集、测试集,训练模型。(略)1.准备1/ 环境win10 64位anaconda3pycharm 2017...

#机器学习#人工智能#python
机器学习实践:中文文本预处理(词袋模型/TF-IDF)

目标:为了实现利用贝叶斯模型进行新闻文本主题分类,对中文文本进行预处理。步骤1.准备2.创建停用词词典3.定义Document类(可省)4.序列化标签 载入数据5.创建词典6.文本向量化方法一:one-hot 表达方法方法二:词袋模型方法三:TF-IDF7.打乱数据集8.划分训练集、测试集,训练模型。(略)1.准备1/ 环境win10 64位anaconda3pycharm 2017...

#机器学习#人工智能#python
python爬虫:关于解决request.get和点击查看网页源代码的内容不同的问题//及大神版js加密参数获取教程指路

首先声明:爬虫小白,虽然爬过几个网站,但是知识几乎都是实践中获取,如果以下说的不对的,请多指正,谢谢!谨此给和我一样的小白提供一个解题思路!目录问题背景解决方案附:excel的下载方式问题背景这两天在做一个爬虫项目,要求爬取页面的附件(excel)并保存,在用分析得到的request url中的k值在源代码中搜索时,幸运的定位到网页源码中隐藏了url信息,确定了爬虫方案。如下:照原理,我...

#python#编程语言
解决合并压缩包分卷无法解压 错误信息:文件格式未知或者压缩文件数据已经损坏

​问题起因:我想要获取Semantic Image-Text-Classes - Datasets - Forschungsdaten-Repositorium der LUH (uni-hannover.de)中的数据集,该数据集的train被分为了49个分卷,当我按照他的要求下载了所有的分卷并执行cat train.tar.part* > train_concat.tar合并分卷后,却无

#bug#windows
机器学习实践:中文文本预处理(词袋模型/TF-IDF)

目标:为了实现利用贝叶斯模型进行新闻文本主题分类,对中文文本进行预处理。步骤1.准备2.创建停用词词典3.定义Document类(可省)4.序列化标签 载入数据5.创建词典6.文本向量化方法一:one-hot 表达方法方法二:词袋模型方法三:TF-IDF7.打乱数据集8.划分训练集、测试集,训练模型。(略)1.准备1/ 环境win10 64位anaconda3pycharm 2017...

#机器学习#人工智能#python
    共 21 条
  • 1
  • 2
  • 3
  • 请选择