logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ollama记录

问题:设置OLLAMA_MODELS=/home/username/ollama/models后,ollama服务无法启动,查看日志:ollama[779068]: Error: mkdir /home/username/ollama: permission denied: ensure path elements are traversable。说是权限问题,但是通过sudo chown +R

#深度学习#python#人工智能
大模型微调、蒸馏记录

每一种数据集评测方法不一样,比如文本生成,指标用BLEU,看回答跟数据集的相似度和流畅度有多少,如果是题目,只需要回答A,B,C,D这种,那就要提示大模型,仅需要回答A,B,C,D,然后用回答跟数据集的文本做比较;lora微调的话,输出的文件是适配器文件,也就是仅包含微调参数的文件,测试时,可以分别加载原始模型和适配器文件,也可以合并原始模型和适配器文件之后,再加载合并后的模型来进行推理;用教师模

文章图片
#人工智能
poetry 配置多个cuda环境心得

有的基于gpu的库不通过python来使用cuda,这时候就要给操作系统安装对应的cuda版本才行。最近学习了用poetry配置python虚拟环境,当为不同的项目配置cuda时,会遇到不同的项目使用的cuda版本不一致的情况。像torch 这样的库,它们会对cuda-toolkit有依赖,通过python来使用cuda,它们会依赖像。这样的依赖就行了,poetry会自动下载依赖的cuda-too

文章图片
#深度学习#人工智能
大模型微调、蒸馏记录

每一种数据集评测方法不一样,比如文本生成,指标用BLEU,看回答跟数据集的相似度和流畅度有多少,如果是题目,只需要回答A,B,C,D这种,那就要提示大模型,仅需要回答A,B,C,D,然后用回答跟数据集的文本做比较;lora微调的话,输出的文件是适配器文件,也就是仅包含微调参数的文件,测试时,可以分别加载原始模型和适配器文件,也可以合并原始模型和适配器文件之后,再加载合并后的模型来进行推理;用教师模

文章图片
#人工智能
SOA AOS 面向对象与面向数据

转载自https://blog.csdn.net/debugconsole/article/details/17788979SOA 数组的结构与AOS结构的数组,是面向数据和面向对象设计的区别之一。在需要高频率(如渲染循环中)访问数据的时候,一般情况下SOA的效率高于AOS,因为将需要频繁访问的数据连续存放会大大提高访问速度。虽然AOS的结构可能更适合面向对象设计,但是在高度依赖效率的地...

CUDA线程调度

1,一个GPU会有多个SM(Streaming MultiProcessor),SM之间是并行的;2,一个SM可以同时处理多个Block的多个wrap,也就是说,同一时刻,一个SM内,不止只有一个wrap在执行;3,SM处理完一个Block后,才会处理下一个Block,也就是说例如SM可以同时处理3个Block,那么这3个Block的其中一个处理完后,才会处理第四个Block。4,一个wrap的线

#c++
到底了