logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

llama-cpp-python 编译 CUDA + Flash Attention 双加速 实战完整指南--Windows

本文详细介绍了在Windows系统下编译支持CUDA和FlashAttention双加速的llama-cpp-python的完整流程。主要内容包括:环境准备(CUDA、PyTorch、flash-attention安装验证)、核心编译步骤(解决Visual Studio版本冲突问题)、三阶段验证方法及故障排查指南。通过强制指定VS2022编译器和设置-DGGML_CUDA=ON、-DGGML_FL

文章图片
#windows#人工智能#python
【OpenClaw 本地实战 Ep.1】抛弃 Ollama?转向 LM Studio!Windows 下用 NVIDIA 显卡搭建 OpenClaw 本地极速推理服务

摘要:本教程介绍在Windows11环境下使用LMStudio替代Ollama搭建OpenClaw本地推理服务的方法。通过三步配置(开启CUDA加速、启动无界面服务、建立OpenAI兼容接口),可充分发挥NVIDIA显卡(如RTX3090)的算力优势。文章详细演示了LMStudio的GPU加速设置和后台服务开启流程,为后续OpenClaw对接奠定基础。该方案解决了Windows平台下Ollama无

文章图片
#windows#人工智能#LM Studio +2
Windows 11 下编译 diff-gaussian-rasterization 完整踩坑记录——PyTorch 2.7.1+cu126 × CUDA Toolkit 13.1 × RTX

本文详细记录了在Windows 11系统下成功编译diff-gaussian-rasterization的全过程。针对PyTorch 2.7.1+cu126与CUDA Toolkit 13.1版本不匹配的问题,提供了绕过CUDA版本检查的解决方案。文章包含完整的环境配置、GLM数学库准备、编译环境变量设置、wheel安装及验证步骤,并总结了常见错误及解决方法。特别适用于RTX 3090显卡用户,解

文章图片
#windows#pytorch#人工智能 +1
OpenClaw搭配LM Studio VS Ollama:Windows CUDA实战深度对比与完全配置指南

本文对比了LMStudio和Ollama在Windows平台下使用NVIDIA显卡运行本地AI模型的性能表现。测试环境为Windows 11+RTX 3090 24GB显卡,核心结论显示:Ollama 0.17.7存在显存调度缺陷,容易回退CPU推理,调试成本高且缺乏可视化界面;而LMStudio 0.4.7-b2提供精细化的CUDA管控、稳定的GPU推理、开放模型生态和友好的图形界面,是当前Wi

文章图片
#windows#人工智能#LM Studio +2
ComfyUI 模型文件名冲突解决指南

《ComfyUI模型文件名冲突解决指南》介绍了一种利用符号链接解决模型文件命名冲突的实用方案。当新旧工作流因模型文件名大小写或连字符差异导致重复下载时,通过创建符号链接(0字节占用)实现"一个文件多个名字"的效果。文章详细演示了Windows系统下使用mklink命令创建符号链接的步骤,以及如何验证和确保ComfyUI正确识别。该方法既能保持新旧工作流的兼容性,又能节省存储空间

文章图片
#人工智能#ComfyUI
冷门干货!llama.cpp 自带原生网页聊天 UI,无需第三方依赖一键开启

原生网页UI自带完整聊天功能,支持多轮对话、上下文记忆,还能调节温度、生成长度、重复惩罚等参数,不用额外配置,开箱即用,同时还兼容OpenAI标准接口,可对接其他客户端。

文章图片
#ui#人工智能
diff-gaussian-rasterization 二次编译复现记录——PyTorch 2.4.0+cu124 × CUDA 12.6 × FaceLift 项目环境

本文记录了在Windows11环境下使用PyTorch 2.4.0+cu124和CUDA 12.6成功编译diff-gaussian-rasterization的全过程。关键发现是:CUDA主版本号匹配比修改源码更重要,PyTorch cu124可与CUDA 12.x任意小版本兼容。编译时仅需切换CUDA版本至12.6,无需修改cpp_extension.py,解决了之前版本不匹配的问题。文章详细

文章图片
#pytorch#人工智能#python +1
Claude Desktop 启用开发者模式 + 配置第三方模型 详细步骤

本文详细介绍了如何在Claude桌面端启用开发者模式并配置第三方模型(如LMStudio)的完整步骤。主要内容包括:准备工作(安装最新版、获取API密钥)、启用开发者模式、配置Gateway连接(填写API地址和密钥)、模型列表设置及验证方法。特别说明第三方模式下会强制注入Claude身份提示词,使任何底层模型都会以Claude身份回复。还提供了常见问题排查方法,指出这是替换模型后端的"

文章图片
#人工智能
精简版|Claude-HUD 插件介绍 + 一键安装教程

Claude-HUD插件是一款专为ClaudeCode终端版设计的状态监控工具,它能实时展示关键信息:Token用量进度条、工具/Agent运行状态、任务进度、Git分支等。安装仅需3步:添加插件市场源、安装插件、重载生效。该插件开箱即用,无需配置,全局生效,能有效防止会话超限,提升开发效率。常用命令包括自定义布局、查看插件列表和卸载插件等。其核心优势在于实时可视化会话状态,让用户清晰掌握模型运行

文章图片
#人工智能
MingLi-Bench 项目部署实录:基于 EPGF 架构的工程化实践

MingLi-Bench是一个评估大语言模型在中国传统命理学(八字和紫微斗数)领域能力的基准测试框架。该项目基于EPGF架构部署,采用"继承而不依赖,封装而解耦"的环境管理理念,通过Conda虚拟环境和项目级.venv实现多版本Python的隔离管理。测试包含160道标准化选择题,覆盖12个人生维度,支持链式推理(--cot)和预计算命盘(--astro)功能。部署过程中解决了

文章图片
#架构#AIGC#人工智能
    共 324 条
  • 1
  • 2
  • 3
  • 33
  • 请选择