
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
8卡3090部署Qwen3-235B-A22B教程
踩坑:一开始以为是掉驱动,后来是发现一张卡估计压力测试下质量翻车了,不过同时研究了换驱动的方法,对于需要更换显存,建议自己看情况换版本,能够避免切换版本导致。然后安装one-api,方便API管理,可以选择不开端口访问,使用lucky转发还便于套证书(这里就不写教程了,很简单),但是局域网环境就开放就行。token数是干到125t/s,之前测试过gguf的30ba3b,这模型基本逻辑能力是不用怀疑
踩坑:一开始以为是掉驱动,后来是发现一张卡估计压力测试下质量翻车了,不过同时研究了换驱动的方法,对于需要更换显存,建议自己看情况换版本,能够避免切换版本导致。然后安装one-api,方便API管理,可以选择不开端口访问,使用lucky转发还便于套证书(这里就不写教程了,很简单),但是局域网环境就开放就行。token数是干到125t/s,之前测试过gguf的30ba3b,这模型基本逻辑能力是不用怀疑
经实际测试,本地部署模型时,若使用 24G 显存,显卡可选择两张 M40 12g(价格约 500 元左右)。当然你有3090等卡更好。目前还在进一步测试,理论上安卓的so库逆向也可以用这个干,MCP动态调试的教程等有空研究了看看。我用的启动参数如下,依据个人需求改就行,弄不来的用ollama改下上下文也行,部署就不做过多教学了。把提示词丢给mcp客户端,再用ida打开对应的文件,插件中启用mcp,
没有选用coder是因为这个Qwen3-30B-A3B-Thinking-2507完全够用了,这里使用了量化版本,上下文达256K,速度还是相当靠谱得,解一道apk逆向得题只花了5分半!这个主要是针对离线环境需求,雷电显卡坞带张4090 48G出去不得直接起飞?显存是吃到42G,所以5090就暂时不要考虑了,4090 48G才是正解。MCP这里用的是jadx-mcp-server。







