logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

最新qwen2_moe模型加载,出现KeyError: ‘qwen2_moe‘报错解决

原因:pip中的最新版的transformers还没有更新,因此用github上的版本更新。

文章图片
#人工智能#transformer#语言模型 +1
huaggingface模型国内网络下载

hf-mirror](https://hf-mirror.com/)是huggingface的镜像网站,在国内可以直接使用,对于新出的模型魔方社区不一定有人第一时间搬运到社区里,所以使用hf-mirror更保险一点。上的大模型时,需要连接外网,但由于出于对服务器的安全性考虑,一般服务器是不会允许连接外网的。操作上和huggingface完全一致,复制命令下载即可。找到你想要的模型,在模型文件里找到

文章图片
#语言模型#人工智能#阿里云
huggingface下载模型总是下载到~/.cache/huggingface的问题解决

其实是软链接,这样做的好处是为了统一管理,即第一次过后假设自己忘记过下载这个文件,再次运行下载命令即可直接获取这个完整的文件,不必从头下载。但这样做的缺陷是如果/home路径所在的磁盘空间紧张,很容易导致磁盘空间爆了,网络上的解决方法是在命令中设置参数。,经过实测,这个参数可以更改下载的临时路径,问题得到解决。,但实测下来这个参数没有任何效果,估计版本升级的原因。为了统一存储管理,默认将文件的下载

文章图片
#人工智能#语言模型#bash
大模型精度

这篇博客详细介绍了浮点数在计算机中的存储方式、不同类型的浮点精度(如FP16、FP32、FP64等)及其用途,以及在深度学习和大模型训练中采用的混合精度训练方法。文章通过理论解释和实例展示,阐述了如何在提高计算效率和节约内存使用的同时,保持数值计算的精度和稳定性。

文章图片
#语言模型#深度学习#pytorch
部署llama3时出现RuntimeError: “triu_tril_cuda_template“ not implemented for ‘BFloat16‘报错

部署llama3时出现RuntimeError: "triu_tril_cuda_template" not implemented for 'BFloat16'报错

文章图片
#深度学习#人工智能#python
RuntimeError: Unexpected error from cudaGetDeviceCount(). Error 802: system not yet initialized问题解决

RuntimeError: Unexpected error from cudaGetDeviceCount(). Error 802: system not yet initialized问题解决

#python#pytorch
【生物信息学】k-mer的基本概念及应用

【生物信息学】k-mer的概念及应用

文章图片
【生物信息学算法】图算法1:概念和算法

本文介绍了图论的基本概念和图的不同分类,包括有向图、无向图和加权图。图的表示方式主要有邻接矩阵和邻接列表,适用于不同的图结构。文中详细讲解了图的基本操作和属性,如添加节点和边、计算节点的度、查找相邻节点等,并通过 Python 代码实现这些操作。此外,还介绍了图的路径、距离的计算方法以及广度优先搜索(BFS)和深度优先搜索(DFS)算法的实现。最后,讨论了环的检测和图论中的欧拉定理,为图的应用提供

文章图片
#算法#python#图论 +2
    共 20 条
  • 1
  • 2
  • 请选择