logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GPT-2 语言模型 - 模型训练

本节代码是一个完整的机器学习工作流程,用于训练一个基于GPT-2的语言模型。

文章图片
#语言模型#人工智能
深度理解loss.backward()函数

是深度学习框架(如 PyTorch)中用于执行反向传播的函数。

#人工智能#深度学习#机器学习
Dify网页版 + vllm + Qwen

【代码】Dify网页版 + vllm + Qwen。

文章图片
#深度学习#人工智能
机器学习 - 加油站数据分析

分析用户“1000113200000151566”常去的加油站点和通常的加油时间;数据集介绍:该表记录了用户在11月和12月一天24小时内的加油信息,包括:持卡人标识(cardholder)、卡号(cardno)、加油站网点号(nodeno)、加油时间(opetime)、加油升数(liter)、金额(amount)统计17:30~18:30期间加油的人数和平均加油量,以及该时间段的加油总量在一天中

文章图片
#机器学习#人工智能
面试篇 - Transformer前馈神经网络(FFN)使用什么激活函数?

GELU(x) = xΦ(x) ≈ 0.5x(1 + tanh[√(2/π)(x + 0.044715x³)])# 近似计算。timeit.timeit(lambda: nn.ReLU()(x), number=100)# 约0.12秒。timeit.timeit(lambda: nn.GELU()(x), number=100)# 约0.18秒。self.activation = nn.ReLU

文章图片
#transformer#神经网络#深度学习
GPT - 2 文本生成任务全流程

这部分代码的功能是初始化一个 GPT-2 模型的配置对象。,该对象将用于后续创建 GPT-2 模型实例。

文章图片
#人工智能
面试篇 - Transformer前馈神经网络(FFN)使用什么激活函数?

GELU(x) = xΦ(x) ≈ 0.5x(1 + tanh[√(2/π)(x + 0.044715x³)])# 近似计算。timeit.timeit(lambda: nn.ReLU()(x), number=100)# 约0.12秒。timeit.timeit(lambda: nn.GELU()(x), number=100)# 约0.18秒。self.activation = nn.ReLU

文章图片
#transformer#神经网络#深度学习
机器学习 - 加油站数据分析

分析用户“1000113200000151566”常去的加油站点和通常的加油时间;数据集介绍:该表记录了用户在11月和12月一天24小时内的加油信息,包括:持卡人标识(cardholder)、卡号(cardno)、加油站网点号(nodeno)、加油时间(opetime)、加油升数(liter)、金额(amount)统计17:30~18:30期间加油的人数和平均加油量,以及该时间段的加油总量在一天中

文章图片
#机器学习#人工智能
【计算机视觉】构造一个3*3卷积核,对一幅512*512*3的原始图像进行卷积操作。其中512*512*3分别表示图像的宽、高和通道数

【代码】【计算机视觉】构造一个3*3卷积核,对一幅512*512*3的原始图像进行卷积操作。其中512*512*3分别表示图像的宽、高和通道数。

文章图片
#计算机视觉#人工智能#opencv
365天深度学习训练营-第T6周:好莱坞明星识别

该方法用于数据集的预取操作。`AUTOTUNE`常量的值由之前定义的`tf.data.AUTOTUNE`决定,它会自动根据可用的系统资源动态选择合适的缓冲区大小,以加速数据加载。`EarlyStopping` 是 Keras 中的一个回调函数,它监视指定的指标(在这个例子中是验证准确率 `'val_accuracy'`),并根据预先设置的条件来判断是否停止训练。通过这些数据集配置操作,可以在训练过

文章图片
#深度学习#人工智能
    共 44 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择