2401_88074772 个人主页

@2401_88074772

2401_88074772

2025-07-04 11:01:06 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

llama.cpp运行deepseek MOE 16b chat

准备：cmake版本＞3.14；deepseek moe chat 16b gguf文件，可以去抱抱脸官网下载。当前运行环境：Ubuntu 18.04.6 LTS (GNU/Linux 4.15.0-194-generic x86_64)g++升级：博主升级到11.4版本，方法好像是站内的，但是找不到网址了。说明此时系统还是使用老的gcc，g++，编译器版本过旧不兼容。然后就可以正常和模型对话了，

#人工智能

非常简单！本地用 llama.cpp 部署deepseek并开启 API 流程

当然，如果是有ollama的话直接下载模型就好了，b站也有详细的教程，我只是学习如何用llama.cpp生成api接口供其他接口调用，后面打算学点模型微调，可以整个自己的模型玩玩。检查你的llama-server安装到哪了，本人安装到了build/bin下，输入下面指令的时候记得修改地址（你模型的地址和llama-server安装的地址）再看日志，模型已经完整加载，llama-server已经监听

#linux #服务器 #vscode

ubantu+vscode配置vins-mono（无可视化）+常见问题解决方法

libpq-dev依赖的libpq5版本与当前系统已安装的版本不匹配，导致依赖冲突，需要降级libpq5到官方指定版本，aptitude最后交互界面输入n拒绝当前方案（当前方案是 “不安装所有依赖”)，aptitude自动提供下一个解决方案：降级到libpq5并安装libpq-dev及其他依赖，此时再选择y。我这里使用的是ubantu18.04和20.04两个版本，流程是一样的，但是ros版本不同

#vscode #ide #编辑器

windows+vscode下的fft3库安装、配置方法

本文介绍了在MSYS2环境下安装和使用FFTW库的方法。首先下载并解压FFTW源码包，在MSYS2终端中执行配置、编译和安装命令。安装完成后通过检查文件验证安装结果。对于VSCode用户，提供了配置JSON文件的示例，包含路径和编译器设置。最后说明编译时需链接FFTW库（-lfftw3参数），并给出运行程序的命令。整个过程涵盖了从安装到实际使用的完整流程，适用于需要进行快速傅里叶变换计算的开发者。

#windows #vscode #c++

llama.cpp运行deepseek MOE 16b chat

#人工智能

非常简单！本地用 llama.cpp 部署deepseek并开启 API 流程

#linux #服务器 #vscode

deepseek moe chat 16b模型量化为gguf q8格式

首先要去hugging face官网下载deepseek moe chat 16b模型，安装llama.cpp基础依赖（这一步不清楚的可以看我第一篇博客。，占用内存大大缩小，再结合llama运行MOE的那篇博客，量化后的模型可以正常对话，回答准确且速度快。突然发现之前博客写了llama运行gguf量化模型但是没写gguf是怎么来的，这里补充一下。模型现在内存占用是16.22GB，相较于原始大小30

#python #人工智能 #深度学习 +1

到底了