logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

NCU使用指南及模型性能测试(pytorch2.5.1)

本项目在原项目的基础上增加了Nsight Compute(ncu)测试的功能,并对相关脚本功能做了一些健硕性的增强,同时,对一些框架的代码进行了更改(主要是数据集的大小和epoch等),增加模型性能测试的效率,同时完善了模型LSTM的有关功能。

文章图片
#python#docker#深度学习 +1
java: error while loading shared libraries: libjli.so: cannot open shared object file: No such file

【代码】java: error while loading shared libraries: libjli.so: cannot open shared object file: No such file。

文章图片
#java#ubuntu#linux +1
jupyter notebook设置代码提示方法

【代码】jupyter notebook设置代码提示方法。

文章图片
#jupyter#python#学习
hadoop伪分布式环境启动时web端访问不到

在搭建hadoop伪分布式环境时,开启hdfs-site.sh后,web端访问不到,但是节点已经正常开启:在尝试关闭防火墙后也没有效果,后来在/etc/hosts文件中加入本机的ip和主机名映射后,重新初始化namenode,web端可以正常访问(hadoop版本3以后默认端口是9870,之前的是50070):

文章图片
#分布式#hadoop#大数据
神经网络的一些benchmark示例

常见的测试类型包括矩阵乘法、向量加法、卷积操作等,通过这些基准可以有效评估硬件资源的利用率、带宽、延迟等关键指标,帮助开发者优化 CUDA 程序的性能。该基准测试框架的目标是推动 GNN 研究的进展,使研究人员能够更有效地开发和优化 GNN 模型,提升其在真实世界应用中的性能。它提供了一个更具挑战性的搜索空间,并基于更广泛的架构评估结果,避免了对真实硬件的高昂训练成本。它支持不同任务类型,包括节点

#神经网络#人工智能#深度学习 +1
神经网络构建原理(以MINIST为例)

Adam 优化器通过结合动量和自适应学习率进行参数更新。详细的更新公式在上面的回答中已经给出。计算当前梯度∇θL∇θ​L的加权平均,用来估计梯度的期望。这个一阶动量主要是累积之前的梯度,使得更新方向更加平滑。mtβ1mt−11−β1∇θLmt​β1​mt−1​1−β1​∇θ​Lβ1\beta_1β1​是一阶动量的衰减率,通常取值为 0.9。mtm_tmt​是当前的动量(梯度的指数加权平均)。

文章图片
#神经网络#人工智能#深度学习 +1
tensorflow算子调用示例(MINIST)

本文以MINIST为例,阐述在模型训练时,tensorflow框架每个算子具体调用kernel的过程。

文章图片
#tensorflow#人工智能#python +3
cuda与机器学习

CUDA是由NVIDIA开发的并行计算平台和编程模型,允许开发者利用支持CUDA的NVIDIA GPU来加速计算密集型任务。CUDA提供了扩展的C/C++语言,以及用于在GPU上执行并行计算的API。线程线程块线程的集合:线程块是多个线程的集合,组成一个可在 GPU 上执行的基本调度单元。线程块索引:通过 、、 获取线程块的索引。线程块大小:通过 、、 获取线程块的维度大小。全局线程索引:结合线程

文章图片
#python#tensorflow#pytorch +2
cuda与机器学习

CUDA是由NVIDIA开发的并行计算平台和编程模型,允许开发者利用支持CUDA的NVIDIA GPU来加速计算密集型任务。CUDA提供了扩展的C/C++语言,以及用于在GPU上执行并行计算的API。线程线程块线程的集合:线程块是多个线程的集合,组成一个可在 GPU 上执行的基本调度单元。线程块索引:通过 、、 获取线程块的索引。线程块大小:通过 、、 获取线程块的维度大小。全局线程索引:结合线程

文章图片
#python#tensorflow#pytorch +2
    共 15 条
  • 1
  • 2
  • 请选择