
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
ollama+qwq
2.单词 “strawberry” 中有多少个字母 “r”?本次验证,直接使用的默认q4量化版本。1.9.9 和 9.11 哪个更大?这里用到的就是三个简单的问题。3.李白的风格写一首七言绝句。通过ollama启动的qwq。回答结果没有任何问题。
Linux+llama.cpp编译+DeepSeek-R1-UD-IQ1_S本地部署
提示词处理速度(token/s)输出文本速度(token/s)克隆llama.cpp。treads/线程数。
ollama+qwq
2.单词 “strawberry” 中有多少个字母 “r”?本次验证,直接使用的默认q4量化版本。1.9.9 和 9.11 哪个更大?这里用到的就是三个简单的问题。3.李白的风格写一首七言绝句。通过ollama启动的qwq。回答结果没有任何问题。
Ktransformers-0.2.2+DeepSeek-R1-Q4_K_M
官方连接来自官方的测试结果llama启动DeepSeek-R1-Q4_K_M 4090*2decode token: 3.73token/s 速度太慢下面就没再测。
Linux+llama.cpp编译+DeepSeek-R1-UD-IQ1_S本地部署
提示词处理速度(token/s)输出文本速度(token/s)克隆llama.cpp。treads/线程数。
到底了







