logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【NLP入门系列六】Word2Vec模型简介,与以《人民的名义》小说原文实践

Word2Vec模型实践:《人民的名义》文本分析 本文介绍了Word2Vec词嵌入模型的基本原理和应用实践。Word2Vec通过将词语映射到向量空间,使相似词距离更近,包含CBOW(上下文预测当前词)和Skip-gram(当前词预测上下文)两种架构。作者以《人民的名义》小说原文为素材,进行了中文文本处理实践。 实践步骤包括: 使用jieba分词并加载自定义人名词典 去除常见停用词 训练Word2V

文章图片
#自然语言处理#word2vec#人工智能 +4
【NLP入门系列二】NLP分词和字典构建

本文介绍了自然语言处理中中文分词的基础概念与方法,主要内容包括: 分词的定义与重要性:解释了词作为最小语义单位的特点,以及分词在文本检索、语音转换等场景中的实际应用价值。 分词规范与难点:介绍了国家标准GB13715的分词规范,重点分析了交集型和覆盖型两类切分歧义案例。 消歧方法:提出利用词法、句法、语义和语用四个层面的上下文信息来解决切分歧义问题。 主要分词算法:对比了正向最大匹配、逆向最大匹配

文章图片
#自然语言处理#人工智能#深度学习 +4
深度学习基础--LSTM学习笔记(李沐《动手学习深度学习》)

忘记门(遗忘门):将朝着0减少输入门:决定是不是要忽略输入数据输出门:决定是不是要使用隐状态👀提示:一下数学公式组合成一块,我感觉就不是那么容易理解了,但是能大概理解即可,后面在案例中实践学习。LSTM原理具体细节确实复杂,但是我感觉可以结合实践慢慢理解,毕竟小编还是本科生🤠🤠.

文章图片
#深度学习#lstm#学习 +4
深度学习基础--目标检测入门简介

📚 一句话,找出图像中感兴趣的物体,确定其位置和类别。由于物体类别不同,其形状、外观、姿态都不同,而且还受环境的影响,故在cv领域,目标检测一直都是一个很热门的话题。🐶 目标检测任务:找出每个物体,类别标注出来,还需要找出具体的位置,位置通常用边缘框表示。边缘框概念用一个边框框主一个物体,如图:这个图要注意一下:坐标系和普通不太一样,主要是坐标。所以,如果物体很多,那需要的成本也是需要很高的。

文章图片
#深度学习#目标检测#人工智能 +3
深度学习基础--CNN经典网络之InceptionV1研究与复现(pytorch)

Network-in-Network(NiN)是一种深度学习架构,它在2013年由Lin等人提出,旨在提高传统卷积神经网络(CNNs)的性能。卷积核来降维,这样虽然加大了网络深度,但是也减少了参数量和计算量,网络结构如上图b所示。去掉两个辅助分支,只复现主要分支(详细请看网络结构),并进行实验,对猴痘病图片进行分类。黄色是头部,主要用于数据处理的,绿色是上面介绍的Inception Module结

文章图片
#深度学习#cnn#网络 +4
基于C++“简单且有效”的“数据库连接池”

表示连接池事先会和 MySQL Serve r创建最小个数的连接,当应用发起 MySQL 访问时,不用再创建和 MySQL Server 新的连接,直接从连接池中获取一个可用的连接即可,使用完成后并不去释放连接,而是把连接再归还到连接池当中。

文章图片
#c++#数据库#adb +4
深度学习基础案例2--从0到1构建CNN卷积神经网络(以识别CIFR10为例)

函数原型:输入通道数:输出通道数:卷积层大小stride:卷积步伐大小padding:添加到输入的所有四个边的填充。默认值:0dilation:扩张操作,控制kernel点(卷积核点)的间距,默认值:1。groups:将输入通道分组成多个子组,每个子组使用一组卷积核来处理。默认值为 1,表示不进行分组卷积。:‘zeros’, ‘reflect’, ‘replicate’或’circular’. 默

文章图片
#深度学习#cnn#人工智能 +4
数学建模--数据处理基本方法(基于matlab),一定要实践!!!!

四分位数Q1是排第25%的数值,上四分位数Q3是排第75%的数值。四分位距IQR= Q3-Q1,也就是排名第75%的减去第25%的数值 正态分布类似,设置个合理区间,在区间外的就是异常值。数值分布在( μ-3σ, μ+3σ)中的概率为99.73%,其中 μ为平均值, σ为标准差。在进行数据一致化之前,必须先判断是属于什么类型数据(极大型、极小型、中间型、区间型)2、判断每个数据值是否在( μ-3σ

文章图片
#matlab#开发语言#数据分析 +1
机器学习/数据分析案例---糖尿病预测

环境:seaborn绘制热力图的时候,版本需要与matplotlib版本配对,matplotlib版本需要在3.8.0以下随机森林:可以决解多重共线性问题进一步熟悉了数据分析的过程不足:算法的扩展性、数据特征提取没有做。

文章图片
#机器学习#数据分析#人工智能 +3
机器学习/数据分析--Pandas常用50个基础操作

【代码】机器学习/数据分析--Pandas常用50个基础操作。

文章图片
#机器学习#数据分析#pandas
    共 25 条
  • 1
  • 2
  • 3
  • 请选择