linzhiji 个人主页

@linzhiji

linzhiji

2022-10-24 15:32:47 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

nvidia-smi 常用命令

官方文档：https://developer.download.nvidia.cn/compute/DCGM/docs/nvidia-smi-367.38.pdfNVIDIA-SMI系列命令总结

#深度学习 #机器学习 #自然语言处理

onnx nvidia cuda cudnn driver 各种版本对应

onnx 和 nvidia cuda， nvidia cudnn 之间对应关系。

#人工智能

nvidia-smi 常用命令

官方文档：https://developer.download.nvidia.cn/compute/DCGM/docs/nvidia-smi-367.38.pdfNVIDIA-SMI系列命令总结

#深度学习 #机器学习 #自然语言处理

React Native 混合ios android开发及常用框架

在集成过程中，需要修改package.json 和 Podfile，按文档中的内容，如果pod install过不了的话，先修改package.json，然后执行命名。再修改Podfile,执行命令。

#react native #android #react.js

ubuntu 18 cuda 11.8 安装 vllm

需要安装官方nccl。

#ubuntu #linux #运维

pip install 安装 torch cuda 11.8 cu118

百度了一下，有推荐这么改的，速度还是慢，因为还是转到官网 pytorch.org。最终采用其中的版本 2.3.1，可以看看 pip 源。默认安装，速度比较慢。

#pip #python #深度学习

大语言模型量化方法对比：GPTQ、GGUF、AWQ 包括显存和速度

AWQ(激活感知权重量化)，它是一种类似于GPTQ的量化方法。所以他们的论文提到了与GPTQ相比的可以由显著加速，同时保持了相似的，有时甚至更好的性能。GGUF(以前称为GGML)是一种量化方法，允许用户使用CPU来运行LLM，但也可以将其某些层加载到GPU以提高速度。虽然使用CPU进行推理通常比使用GPU慢，但对于那些在CPU或苹果设备上运行模型的人来说，这是一种非常好的格式。GPTQ是一种4位

#语言模型 #人工智能 #自然语言处理

React native RN 开发实例

【代码】React native RN 开发实例。

#react native #react.js #javascript

onnxruntime 不使用 gpu

检查 onnxruntime和 cuda 和 cudnn 的版本对应关。检查安装的 onnx。

#windows #linux #运维

onnx onnxruntime onnxruntime-gpu

（和Java生成的中间文件可以在JVM上运行一样，onnx runtime引擎为生成的onnx模型文件提供推理功能）在训练模型时可以使用很多不同的框架，比如 Pytorch， TensorFLow， MXNet，以及深度学习最开始流行的 Caffe 等等，这样不同的训练框架就导致了产生不同的模型结果包，在模型进行部署推理时就需要不同的依赖库，而且同一个框架比如 tensorflow 不同的版本之间

共 52 条

请选择