logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

cuda与机器学习

CUDA是由NVIDIA开发的并行计算平台和编程模型,允许开发者利用支持CUDA的NVIDIA GPU来加速计算密集型任务。CUDA提供了扩展的C/C++语言,以及用于在GPU上执行并行计算的API。线程线程块线程的集合:线程块是多个线程的集合,组成一个可在 GPU 上执行的基本调度单元。线程块索引:通过 、、 获取线程块的索引。线程块大小:通过 、、 获取线程块的维度大小。全局线程索引:结合线程

文章图片
#python#tensorflow#pytorch +2
NCU使用指南及模型性能测试(pytorch2.5.1)

本项目在原项目的基础上增加了Nsight Compute(ncu)测试的功能,并对相关脚本功能做了一些健硕性的增强,同时,对一些框架的代码进行了更改(主要是数据集的大小和epoch等),增加模型性能测试的效率,同时完善了模型LSTM的有关功能。

文章图片
#python#docker#深度学习 +1
java: error while loading shared libraries: libjli.so: cannot open shared object file: No such file

【代码】java: error while loading shared libraries: libjli.so: cannot open shared object file: No such file。

文章图片
#java#ubuntu#linux +1
jupyter notebook设置代码提示方法

【代码】jupyter notebook设置代码提示方法。

文章图片
#jupyter#python#学习
神经网络的一些benchmark示例

常见的测试类型包括矩阵乘法、向量加法、卷积操作等,通过这些基准可以有效评估硬件资源的利用率、带宽、延迟等关键指标,帮助开发者优化 CUDA 程序的性能。该基准测试框架的目标是推动 GNN 研究的进展,使研究人员能够更有效地开发和优化 GNN 模型,提升其在真实世界应用中的性能。它提供了一个更具挑战性的搜索空间,并基于更广泛的架构评估结果,避免了对真实硬件的高昂训练成本。它支持不同任务类型,包括节点

#神经网络#人工智能#深度学习 +1
神经网络构建原理(以MINIST为例)

Adam 优化器通过结合动量和自适应学习率进行参数更新。详细的更新公式在上面的回答中已经给出。计算当前梯度∇θL∇θ​L的加权平均,用来估计梯度的期望。这个一阶动量主要是累积之前的梯度,使得更新方向更加平滑。mtβ1mt−11−β1∇θLmt​β1​mt−1​1−β1​∇θ​Lβ1\beta_1β1​是一阶动量的衰减率,通常取值为 0.9。mtm_tmt​是当前的动量(梯度的指数加权平均)。

文章图片
#神经网络#人工智能#深度学习 +1
cuda与机器学习

CUDA是由NVIDIA开发的并行计算平台和编程模型,允许开发者利用支持CUDA的NVIDIA GPU来加速计算密集型任务。CUDA提供了扩展的C/C++语言,以及用于在GPU上执行并行计算的API。线程线程块线程的集合:线程块是多个线程的集合,组成一个可在 GPU 上执行的基本调度单元。线程块索引:通过 、、 获取线程块的索引。线程块大小:通过 、、 获取线程块的维度大小。全局线程索引:结合线程

文章图片
#python#tensorflow#pytorch +2
tensorflow底层架构

TensorFlow 的架构分为多个层次,从上层的 Python 和 C++ 客户端到底层的设备管理和分布式计算。上层提供了用户友好的 API,用于定义和执行计算图;中层处理数据流的执行和分布式计算;底层则负责与硬件设备的交互,确保计算任务能够高效地在不同设备上执行。这种分层结构使得 TensorFlow 既能方便用户使用,也能够高效处理大规模的深度学习任务。

文章图片
#tensorflow#架构#人工智能 +3
基于tensorflow使用VGG16实现猫狗识别

【代码】基于tensorflow使用VGG16实现猫狗识别。

文章图片
#tensorflow#python
    共 24 条
  • 1
  • 2
  • 3
  • 请选择