logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习:详解word2vec + 实践操作(包括text2word)

Text2vec 的输入是整个文本序列,输出是文本序列对应的向量表示。Word2vec 的训练目标是最小化相似单词在空间中的距离或最大化不相似单词在空间中的距离。Text2vec 的训练目标是最小化文本之间的距离或最大化相似文本的相似度。Text2vec 和 Word2vec 都是用于将文本(文本中的单词或字符)转换为向量的方法。Word2vec 的输入是单个单词,输出是单词对应的向量表示。Tex

文章图片
#深度学习#word2vec#人工智能
深度学习:huggingface简单介绍---常用函数(数据集处理+dict+model),简单使用(tokenzier + model),简单例子(中文分类+中文填空+中文句子关系推断)

huggingface是一个开源社区,它提供了先进的NLP模型,数据集、以及其它便利工具。huggingface提供的模型非常多,但主要的模型为:自回归: GPT2Trasnformer-XLXLNet自编码: BERTALBERTRoBERTaELECTRA自回归模型:预测下一个词,因为使用x获取y叫做回归,所有x预测下一个x称为自回归自编码模型:还原出本身,根据上下为还原出本身的词Seq2Se

文章图片
#分类#数据挖掘#人工智能
FP32,TF32,FP16,BF16介绍

浮点数是一种数据类型,指有小数点的实数。以二进制存储在计算机中时,包括符号位,指数位和小数位(尾数位)。浮点型数据分为:单精度(float,4字节,32比特)与双精度(double,8字节,64位比特)不同于定点数,浮点型数据以二进制存储在计算机中,因此计算时一般都是有误差,都是近似。(一般期望两个浮点型的误差相互抵消,所以一般使用同类型的浮点数进行相互计算例:0.1用二进制表示,将是一个无限循环

文章图片
#深度学习
到底了