logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

对Tesla V100的理论性能测评和与5060Ti的对比

NVIDIA Tesla V100 SXM2 16G评测摘要 Tesla V100作为2017年发布的Volta架构计算卡,曾凭借640个Tensor Core和815mm²大核心在AI计算领域占据重要地位。测试显示其FP64性能达6.93TFLOPS,FP16性能高达105TFLOPS,显存带宽900GB/s。但与新一代RTX 5060Ti对比发现:V100在FP64保持20倍优势,但新卡在BF

文章图片
#人工智能
解决flash attention提示model not initialized on GPU的方法

最初以为是flash attention 2的安装问题,使用了。至此,flash attention不再提示加载问题。中提供的测试代码,进行测试,发现安装没有问题。在加载函数中强制将模型加载到GPU。

#人工智能#深度学习#python +3
在Windows系统编译llama-cpp-python

本文分享了在Windows系统下编译安装Llama-cpp-python库的经验。作者详细介绍了从Ubuntu迁移到Windows时遇到的编译问题,指出相比Pytorch,Llama-cpp-python的安装更为复杂。文中提供了具体的操作步骤:安装Visual Studio的C++开发组件、配置CUDA环境变量、使用VS命令提示窗设置编译参数并安装。文章还特别提到Windows下的编译效率问题,

#python#开发语言#linux +3
解决flash attention提示model not initialized on GPU的方法

最初以为是flash attention 2的安装问题,使用了。至此,flash attention不再提示加载问题。中提供的测试代码,进行测试,发现安装没有问题。在加载函数中强制将模型加载到GPU。

#人工智能#深度学习#python +3
到底了