Rashomon-6 个人主页

@weixin_44466379

Rashomon-6

2022-12-23 13:41:12 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

vLLM实战：本地部署大模型的性能之王

vLLM是大模型本地部署的性能利器，通过PagedAttention算法和连续批处理技术，能显著提升推理速度与并发能力。相比ollama，vLLM吞吐量提升4.6倍，延迟降低57%，但需要更高配置（推荐RTX3090+16GB显存）。文章详细介绍了Docker和源码两种部署方式，以及性能优化技巧，并分享了网络运维助手的实战案例。vLLM适合生产环境高并发场景，而ollama更适合个人低配使用。文末

Obsidian 越用越乱？我用 Codex 重构了一整套知识系统

这篇文章详细介绍了作者如何重构Obsidian知识库，使其从杂乱无章变得系统可用。核心思路是：首先建立清晰的层级结构（总览/收件箱/领域/资源库/归档/模板），明确区分领域、专题和系列三种内容类型；其次规范命名规则和元数据标准，确保文件可检索；最后精简工具链，主要依靠Dataview插件实现自动化管理。作者特别强调，知识库的价值不在于收集内容的数量，而在于能否持续找到、理解和扩展知识。通过Code

#人工智能 #知识图谱

我把知识库自动化了：Hermes 负责生成，Codex 负责正式入库

这篇文章完整记录了我如何把 Hermes、Codex 和 Obsidian 串成一条自动化知识库流水线：从服务器每日生成内容，到 SSH 同步、本地暂存、待确认收件箱，再到正式入库与知识地图更新，整个过程都可复现。

#自动化 #人工智能 #运维

我把知识库自动化了：Hermes 负责生成，Codex 负责正式入库

#自动化 #人工智能 #运维

Ollama 实战排障：为什么明明装了显卡，模型却跑在 CPU 上？一套完整可复现的 GPU 排查方法

摘要：在CentOS8服务器部署Ollama时，模型qwen3.5:9b意外运行在CPU而非RTX3060 GPU上。通过系统化排查（驱动验证、服务日志分析、环境变量检查、权限确认等），发现根因是Ollama运行库目录/usr/local/lib/ollama为空，导致CUDA后端加载失败。通过软链接修复库路径后问题解决。本文强调排障的核心并非单一命令，而是建立"先定性后缩圈"

#python #人工智能 #深度学习

Ollama + Llama 3 实战：在本地跑通大模型应用，这可能是最保姆级的教程

本文详细介绍了使用Ollama+Llama3在本地部署大模型的完整教程。主要内容包括：Ollama的优势分析（一键安装、自动模型管理、内置API）、Llama3模型下载方法、命令行交互与API调用示例（含Python代码）、性能优化技巧（模型选择、参数调整等）以及常见问题解决方案。文章重点演示了如何搭建网络运维助手应用，并提供了代码实现。Ollama以其简便性成为本地开发首选工具，支持多种硬件配置

设备、IP、变更、知识库、AI 全都分散着管，网络运维为什么总在“救火”？

一套真正面向网络工程师、网络管理员、网络架构师的本地优先、一体化、能落到实际业务里的网络运维桌面应用

#人工智能 #网络 #云计算

到底了