不甘平凡的小鸟个人主页

@zhushentian

不甘平凡的小鸟

2022-12-07 18:56:51 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

ollama记录

问题：设置OLLAMA_MODELS=/home/username/ollama/models后，ollama服务无法启动，查看日志：ollama[779068]: Error: mkdir /home/username/ollama: permission denied: ensure path elements are traversable。说是权限问题，但是通过sudo chown +R

#深度学习 #python #人工智能

大模型微调、蒸馏记录

每一种数据集评测方法不一样，比如文本生成，指标用BLEU，看回答跟数据集的相似度和流畅度有多少，如果是题目，只需要回答A,B,C,D这种，那就要提示大模型，仅需要回答A,B,C,D，然后用回答跟数据集的文本做比较；lora微调的话，输出的文件是适配器文件，也就是仅包含微调参数的文件，测试时，可以分别加载原始模型和适配器文件，也可以合并原始模型和适配器文件之后，再加载合并后的模型来进行推理；用教师模

#人工智能

poetry 配置多个cuda环境心得

有的基于gpu的库不通过python来使用cuda，这时候就要给操作系统安装对应的cuda版本才行。最近学习了用poetry配置python虚拟环境，当为不同的项目配置cuda时，会遇到不同的项目使用的cuda版本不一致的情况。像torch 这样的库，它们会对cuda-toolkit有依赖，通过python来使用cuda，它们会依赖像。这样的依赖就行了，poetry会自动下载依赖的cuda-too

转载自https://blog.csdn.net/debugconsole/article/details/17788979SOA 数组的结构与AOS结构的数组，是面向数据和面向对象设计的区别之一。在需要高频率（如渲染循环中）访问数据的时候，一般情况下SOA的效率高于AOS，因为将需要频繁访问的数据连续存放会大大提高访问速度。虽然AOS的结构可能更适合面向对象设计，但是在高度依赖效率的地...

CUDA线程调度

1，一个GPU会有多个SM（Streaming MultiProcessor）,SM之间是并行的；2，一个SM可以同时处理多个Block的多个wrap，也就是说，同一时刻，一个SM内，不止只有一个wrap在执行；3，SM处理完一个Block后，才会处理下一个Block，也就是说例如SM可以同时处理3个Block，那么这3个Block的其中一个处理完后，才会处理第四个Block。4，一个wrap的线

#c++

到底了