logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【深度学习】不同领域中对于token的理解

虽然一个Token通常对应一个单词,但在一些情况下,它也可能是一个词组,甚至是单词的子部分。比如,它可以通过记住“de”和“bug”这两个Token,来扩展理解更多由相同子词构成的词汇,例如“debug”,“devalue”,甚至是“decrease”(减少)在Tokenization过程中,一个Token不仅仅可以是一个完整的单词,它还可以是一个词组,甚至是单词的部分,具体取决于上下文和算法。在

#深度学习#easyui#人工智能 +1
【Linux】nvidia-smi输出参数详解

GPU 持久模式状态,On 或 Off两种状态,持久性模式决定了GPU初始化是否保持激活状态,开启后有助于避免GPU重复初始化,从而减少延迟。: 计算模式,Default 表示默认的计算模式,可能会有其他模式如 Exclusive, Prohibited 等。:GPU 实例 ID,适用于支持 MIG 的 GPU。:当前性能状态(P-State),取值范围为 P0(最高性能)到 P12(最低性能):

文章图片
#linux#运维#服务器 +1
【Docker】Docker容器中安装python、cuda、cudnn、pytorch、opencv、tensorrt

是一个常用选项,用于自动确认所有提示。这意味着在运行命令时,不会提示用户进行确认操作,系统会自动回答“是”并继续执行。中科大:https://pypi.mirrors.ustc.edu.cn/simple/清华源:https://pypi.tuna.tsinghua.edu.cn/simple/阿里云:http://mirrors.aliyun.com/pypi/simple/豆瓣源:http:/

#python#docker#pytorch
【深度学习】神经网络灾难性遗忘(Catastrophic Forgetting,CF)问题

灾难性遗忘(Catastrophic Forgetting)是指在神经网络,尤其是深度学习模型中,当模型在学习新的任务时,往往会遗忘之前学过的任务或知识。这种现象通常发生在连续学习过程中,即模型必须依次学习多个任务时。随着新任务的学习,模型会在不加保护的情况下丧失对旧任务的记忆或表现,导致旧任务的性能显著下降。

#深度学习#神经网络#人工智能 +1
【深度学习】训练集、测试集、验证集、过拟合、欠拟合详解

在机器学习和深度学习中,数据集的划分是模型训练过程中至关重要的一步。常见的数据划分方式包括:训练集(Training Set)、验证集(Validation Set)和测试集(Test Set),本文将详细介绍他们的作用。

文章图片
#深度学习#人工智能#神经网络
【深度学习】图片数据处理和清洗

数据清洗是数据处理的一项重要步骤,对于深度学习算法至关重要,通常在采集到大量数据进行标注训练前需要做一些数据清洗工作。

文章图片
#深度学习#人工智能#职场和发展 +1
【YOLOV8】YOLOV8模型训练train及参数详解

训练深度学习模型涉及为其提供数据并调整其参数,以便它能够做出准确的预测。Ultralytics YOLOv8 的训练模式专为有效、高效地训练目标检测模型而设计,充分利用现代硬件的能力。本指南旨在涵盖使用 YOLOv8 强大功能集训练自定义模型所需的所有细节,帮助你快速入门。

【Pytorch】model.eval()与model.train()

如果模型中有BN层(Batch Normalization)和Dropout,在测试时添加model.eval()。保证BN层能够用全部训练数据的均值和方差,即测试过程中要保证BN层的均值和方差不变。如果模型中有BN层(Batch Normalization)和Dropout,需要在训练时添加model.train()。model.train()是保证BN层能够用到每一批数据的均值和方差。在测试集

文章图片
#pytorch#人工智能#机器学习
【深度学习】图片数据处理和清洗

数据清洗是数据处理的一项重要步骤,对于深度学习算法至关重要,通常在采集到大量数据进行标注训练前需要做一些数据清洗工作。

文章图片
#深度学习#人工智能#职场和发展 +1
【集成学习】Bagging、Boosting、Stacking算法详解

集成学习(Ensemble Learning)是一种通过结合多个模型的预测结果来提高整体预测性能的技术。它通过将多个学习器的结果集成起来,使得最终的模型性能更强,具有更好的泛化能力。常见的集成学习框架包括:Bagging、Boosting、Stacking。

文章图片
#集成学习#boosting#算法 +3
    共 25 条
  • 1
  • 2
  • 3
  • 请选择