logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

《自然语言处理学习之路》06 隐马尔科夫模型HMM

书山有路勤为径,学海无涯苦作舟一、马尔科夫模型1.1 马尔科夫天气案例天气变化种类:晴天,多云,雷雨,他们之间应该有些联系吧!状态之间可以发生转换,昨天和今天转换的情况:状态转移矩阵今天能得到明天的情况,明天能得到后天的情况,以此类推可以无限的玩下去那是不是得有一个初始的情况才能一直玩下去啊!这里我们就定义好了一个一阶马尔科夫模型:状态:晴天,多云,雷雨状态转换概率:三种天气状态间的转换概率初始概

文章图片
#自然语言处理#人工智能#机器学习
《自然语言处理学习之路》10 基于bag of words 和 word2Vec 的影评情绪分类

书山有路勤为径,学海无涯苦作舟一、数据预处理1.1 数据清洗导入库import osimport reimport numpy as npimport pandas as pdfrom bs4 import BeautifulSoupfrom sklearn.feature_extraction.text import CountVectorizerfrom sklearn.ensemble im

#word2vec#自然语言处理#python
《自然语言处理学习之路》01 搜索引擎(TFIDF)及其简单实现

本文主要是学习参考莫烦老师的教学,对老师课程的学习,记忆笔记。原文链接文章目录书山有路勤为径,学海无涯苦作舟。零、吃水不忘挖井人一、搜索引擎1.检索文字信息2.2 检索图片,视频信息2.3 倒排索引(快速检索)2.4 匹配排序TF-IDF2.4.1 TF-IDF原理2.4.2 检索中TFIDF的实现2.4.3 TFIDF的数学表达形式二、代码实现2.1 初步假定15篇文章2.2 TF-IDF2.3

文章图片
#搜索引擎#自然语言处理#深度学习
《从青铜学到王者》Python 深度学习 之 深度学习概述,正向传播,反向传播 01

文章目录每天一遍,学习不厌深度学习概述引言机器学习与深度学习对比传统机器学习过程深度学习过程(以图像数据为例)神经网络简介神经元突触人工神经网络神经网络基本结构(NN)神经网络训练过程正向传播(FP -Forward Propagation )反向传播(BP- Backward Propagation )代码实现每天一遍,学习不厌深度学习概述引言早期的深度学习受到了神经科学的启发它们之间有着非常密

文章图片
#python#深度学习#神经网络
《自然语言处理实战 01》商品信息与文本数据的挖掘分析

文章目录书山有路勤为径,学海无涯苦作舟一、数据的导入1.1 模块设置1.2 数据导入1.3 数据的log变换二、商品的包邮、类别、价格、品牌分析2.12.2 类别分析2.2.1 主类别分析2.2.2子类别分析2.3 不同类别的浮动区间2.4 品牌分析三、商品描述分析3.1 商品描述文本长度与价格因素3.2 品牌描述统计,词云分析3.2.1 统计3.2.2 不同类别商品的关键词词云四、文本挖掘4.1

文章图片
#python#自然语言处理#机器学习
《自然语言处理学习之路》09 使用Gensim库构造词向量Word2Vector

书山有路勤为径,学海无涯苦作舟一、Gensim构造词向量1.1 数据预处理from gensim.models import word2vecimport logging# 自定义打印日志logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level = logging.INFO)原始语料raw_sente

文章图片
#自然语言处理
《自然语言处理之路》12走进深度学习网络,损失函数,Softmax,反向传播

文章目录书山有路勤为径,学海无涯苦作舟凡事我不能创造的,我就不能理解一、比较二、图像分类2.1计算机识别的挑战2.1.1 角度改变2.1.2 光照的强度2.1.3 形状的改变2.1.4 部分遮蔽2.1.5 背景混入2.2 深度学习的套路3 K-NN算法验证3.1 KNN计算步骤3.2 KNN算法基本要素3.3 数据集 CIFAR-103.4 图像数据的距离计算4.超参数与交叉验证4.1 距离计算4

#深度学习#自然语言处理#pytorch
《自然语言处理学习之路》05 新闻分类任务实战

书山有路勤为径,学海无涯苦作舟一、数据及文本分析1.1 数据内容data:1.2 停用词停用词1.语料中大量出现⒉没啥大用(不能体现文章内容,还增加了文本特征,干扰分析,删除了也不影响表现文章主要意思)3.留着过年嘛?1.3 TF-IDF:关键词提取1.3.1 TF《中国的蜜蜂养殖》∶进行词频(Term Frequency,缩写为TF)统计出现次数最多的词是---- “的”、“是”、“在”----

文章图片
#自然语言处理#人工智能
《自然语言处理学习之路》02 词向量模型Word2Vec,CBOW,Skip Gram

本文主要是学习参考莫烦老师的教学,对老师课程的学习,记忆笔记。原文链接文章目录书山有路勤为径,学海无涯苦作舟。零、吃水不忘挖井人一、计算机如何实现对于词语的理解1.1 万物数字化1.2 距离的计算1.3 训练词向量1.4 词向量的用法1.5 词向量的加减运算二、训练词向量模型(Continuous Bag of Words)2.1书山有路勤为径,学海无涯苦作舟。零、吃水不忘挖井人请支持老师的原文原

文章图片
#自然语言处理#深度学习#机器学习
《自然语言处理学习之路》03 字符串基础、正则表达、NLTK、Spacy、Jieba、WordCloud词云

书山有路勤为径,学海无涯苦作舟一、字符串的基本操作1.1脱去多余字符左右同时脱去input_str = '今天天气真不错,风和日丽 'input_str.strip()'今天天气真不错,风和日丽'左脱去、右脱去input_str = ' 今天天气真不错,风和日丽 'input_str.rstrip()input_str = ' 今天天气真不错,风和日丽 'input_str.lstrip()' 今

文章图片
#正则表达式#自然语言处理#python
    共 17 条
  • 1
  • 2
  • 请选择