logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GTX1080ti 安装cuda-8.0和cudnn-7.5

前面一章讲了安装1080ti驱动的一些坑,首先查看自己的显卡驱动sudo nvidia-smi显示,比较奇怪,明明已经安装成功了为啥还是显示0 Graphics Device     Off,理论上这边应该显示GTX1080 ti,在安装1080的时候就现实gtx1080Wed Apr  5 14:43:15 2017       +------------------------

CUDA库之nvjpeg(一):入门介绍

nvJPEG 库提供了高性能,GPU加速的JPEG图像格式的解码函数,并且普遍应用在深度学习领域和超大规模的多媒体应用中。这个库提供单张图或者多张图同时解码的能力,可以充分利用GPU资源和优化效率,并且使用者也可以管理需要解码的内存,灵活性还是比较强的。使用JPEG图像数据流作为输入从数据流中获取图像的宽和高使用以上获取的信息来管理GPU内存并执行解码操作nvJPEG提供了专用的API,用于从原始

#图像处理
CUDA学习(三):查询GPU设备

文章目录一、cudaDeviceProp 类二、Demo获取显卡名称一、cudaDeviceProp 类全靠荡,中文不全可以看英文/*** CUDA device properties*/struct __device_builtin__ cudaDeviceProp{charname[256];/**< 设备名称,比如1080Ti ASCII string identifying devi

数字图像处理(十)图像分割之全局阈值处理、otsu阈值处理、多阈值处理、可变阈值处理、多变量阈值处理

本篇所有代码都是基于24位BMP图像一. 基本的全局阈值处理当图像的前景和背景相关的只方图之间存在一个相当清晰的波谷时,这个算法效果很好。这部分算法比较简单,由于时间关系,并没有写相关代码算法步骤:一、为全局阈值T选择一个初始的估计值(一般选平均灰度)二、用T分割该图像产生的像素组,G1为灰度值大于T的所有像素组成,G2为灰度值小于T的所有像素组成三、对G1和G2分别计算平均灰度值m1和m2,计算

linux系统密码正确但是一直登录不了报错Account locked due to failed logins

转自linux系统密码正确但是一直登录不了报错Account locked due to failed logins1.Account locked due to failed logins …这个错误是因为次数过多的原因导致的,如果不是root用户可以通过root执行以下命令清楚错误次数方法:pam_tally2 --user=test#查看错误了几次pam_tally2 --user=test

大模型训练框架DeepSpeed使用入门(1): 训练设置

大模型训练的痛点是模型参数过大,动辄上百亿,如果单靠单个GPU来完成训练基本不可能。所以需要多卡或者分布式训练来完成这项工作。DeepSpeed是由Microsoft提供的分布式训练工具,旨在支持更大规模的模型和提供更多的优化策略和工具。对于更大模型的训练来说,DeepSpeed提供了更多策略,例如:Zero、Offload等。本文简单介绍下如何使用DeepSpeed。

rapidjson!完美的C++解析json库

感谢开源! git上有很多解析json的库文件,比如常见的JsonCpp、cJSON等,这些都能满足正常使用。但一旦有了速度、轻量化、简便的追求,就不得不比较一下各个库的优劣了。荡某乎上的一张各种比较json的性能图,可以看出,rapdJson处于领先地位!楼主自从体验了rapidJson,就果断放弃了JsonCpp,原因也很简单!RapidJson的github地址:https://github

TensorRT(10):python版本安装

随着TensorRT8.0版本的发布,windows下也正式支持Python版本了,跟紧NVIDIA的步伐,正式总结一份TensorRT-python的使用经验。一、底层库依赖在安装TensorRT前,首先需要安装CUDA、CUDNN等NVIDIA的基本库,如何安装,已经老生常谈了,这里不再过多描述。关于版本的选择,楼主这里:CUDA版本,楼主这里选择的是 cuda11.5 ,具体cuda版本见

#python#深度学习#pytorch
TensorRT(7):python版本使用入门

TensorRT系列传送门(不定期更新): 深度框架|TensorRT文章目录一、TRT在线加载模型,并构建推断引擎的步骤二、在线加载onnx模型,序列化保存到本地三、反序列化直接加载保存后的trt模型四、构建cuda数据,推断trt模型本文以onnx分类模型为例,简单介绍TRT-python版本的使用流程,这里不涉及量化,就以fp32为例,验证在线加载onnx模型、序列化保存为trt模型、加载序

Ubuntu服务器更改ip地址后,遇到ssh无法连接

给服务器配置固定ip地址后,用ssh登录新的ip地址始终无法连接花了半天时间,在https://bbs.csdn.net/topics/230066998这篇文章中终于找到解决方案。这篇文章提到 DNS反向解析的问题?这个问题笔者也无法解释,先记个坑,后面来填。这里主要记录一下解决过程:修改/etc/ssh/sshd_config 文件中的UseDNS yes 改成 UseDNS nosudo g

    共 113 条
  • 1
  • 2
  • 3
  • 12
  • 请选择