逍遥山人~ 个人主页

@u012975197

逍遥山人~

2023-07-04 21:47:58 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

⑨番外篇II，FastLLM——老卡也能跑满血DeepSeek

我经常想：“我的显卡只有 RTX 4060 8G，能跑 DeepSeek 吗？“服务器上还有张 5090 24G，高不成低不就，只能吃灰吗？“vLLM 装不上，CUDA 版本太低了怎么办？这些问题，vLLM 回答不了——vLLM 不是为这些场景设计的。但 FastLLM 可以。经粉丝晓东同志让那些"不够格"的硬件，也能跑大模型。这篇文章是我的调研笔记，也是一份选型参考。声明：本文未做实测，所有性能

#人工智能 #运维

⑦：LiteRT-LM——端侧部署的未来展望

到此，本地大模型部署工具实战手册7 篇全部完成。标题核心收获①你真的需要本地部署吗？场景决策树，隐私 + 成本动机②Ollama实战：RTX 4060从安装到跑起来能跑起来，Modelfile 自定义③vLLM实战：单卡/多卡部署生产级高并发，显存常驻逻辑④LM Studio：5分钟尝鲜零门槛，常见坑避雷⑤三个工具到底怎么选？决策矩阵，真实案例参考⑥公开benchmark数据解读看懂数据，结合硬件

#人工智能

vllm在Linux上安装使用指南

老规矩，该教程是针对没有sudo权限的普通用户；以下是在 Conda 虚拟环境中使用 vLLM 部署模型的完整教程。

#linux #运维

llama.cpp 在 Linux 上安装使用指南

场景推荐方案快速上手生产部署 / GPU 加速源码编译 +单模型长期服务常驻多模型按需切换路由模式（需最新源码版本）工具调用 / Qwen3.x 模型llama.cpp 优于 Ollama。

#linux #运维

llama.cpp 在 Linux 上安装使用指南

#linux #运维

⑧：番外篇I，llama.cpp——Ollama与vLLM之外的第三选择

本来本栏目的定位着重于不需要太多专业知识，鼠标点点就能实现本地部署和使用大模型，但在粉丝晓东同志提醒后感觉有必要再补上两篇关于 llama.cpp 和 FastLLM 的文章；这两个实在太香了，llama.cpp 对工具调用的支持比ollama完善很多，而 FastLLM 让"不够格"的硬件，也能跑大模型。本地部署这件事，工具只是手段，目的是稳定可靠地跑起你需要的模型。

Ollama导入和使用模型详解

SYSTEM "你是一个幽默的助手，用轻松的方式回答问题"优先下载 GGUF— 直接从 HuggingFace / ModelScope 获取 GGUF 版本，省去转换步骤目录结构规范— 每个模型建独立目录，Modelfile 与模型文件同目录网络好时用在线加载一键搞定网络受限或特定版本— 下载 GGUF 后手动导入企业部署— 用 Modelfile 统一配置，便于版本管理导入后立即测试— 验证模

#人工智能

让AI真正“看见“界面：纯视觉GUI自动化编排器开源了

browser-agent 尝试回答一个很简单的问题——如果 AI 能像人一样"看屏幕"操作，那我们还需要为每种软件写适配器吗？我觉得不需要。欢迎试试。GitHub:PyPI:求索实验室聚焦 AI Agent、GUI 自动化、开源工具。

#人工智能 #自动化 #运维

antirez 替中国 AI 喊冤：欲加之罪何患无辞

“训练数据污染"在 ToS 层面是"以被发现为前提”——这本身就证明了"小规模污染"是可能的；但"工业规模污染"在中国 AI 公司的执行层面没有证据支持。——他不代表 Meta、不代表 Google、不代表 OpenAI、不代表任何中国公司。——因为中国 AI 是开源的（DeepSeek / Qwen / GLM 全部开源），——指出中国的AI发展不可能基于蒸馏国外闭源模型，这个指控完全是欲加之罪

#人工智能

【第010期】2026年4月12日 AI日报

摘要：AI行业正面临社会焦虑与技术落地的双重挑战。OpenAI CEO遭袭后反思技术发展，宇树机器人量产成本降至10万内加速商用，华为盘古大模型深耕工业场景。同时，AI初创公司Yupp因技术迭代过快倒闭，凸显商业模式脆弱性。监管新规出台为行业划定边界，技术迭代正成为商业最大变量。（149字）

#人工智能 #科技

共 68 条

请选择