logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

vllm 安装

建议在WSL2的Ubuntu中安装vLLM以避免Windows兼容性问题。安装方法:通过阿里云镜像pip install vllm,验证版本后即可使用。主要命令vllm serve支持加载HuggingFace模型或本地路径,可配置张量并行(多GPU)、上下文长度(如32K tokens)和量化选项(如GPTQ-int4)。典型用例包括:32B大模型需2个GPU并行,7B小模型单GPU运行。关键参

win11 安装 Claude Code

本文介绍了ClaudeCode的安装与使用指南。主要内容包括:1) 提供官方文档和VSCode插件链接;2) 详细说明Windows、macOS和Linux系统的安装命令;3) 解决安装过程中可能出现的区域限制问题(需设置代理);4) 配置环境变量和模型设置方法;5) 演示基本使用流程,包括项目目录创建和交互式操作;6) 说明如何通过配置文件切换不同API服务(如Deepseek、阿里云百炼)。文

文章图片
windowns Ollama 下载,安装,本地部署大模型

Ollama使用指南摘要 Ollama是一个本地运行大语言模型的工具,支持多种AI模型的下载和管理。主要功能包括:1)通过官网下载安装包或使用PowerShell脚本安装;2)支持搜索和下载不同参数的模型(如deepseek-r1);3)提供命令行交互界面,可查看本地模型列表、运行状态及统计信息;4)允许自定义模型存储位置;5)包含丰富的命令集(pull/run/stop/list等)。典型使用流

文章图片
#windows
WSL2 Ubuntu安装Ollama

可以把这个写入到:~/.bashrc,然后:source ~/.bashrc。默认模型存储位置:~/.ollama/models。如搜索:deepseek,Qwen,gemma。可能会卡,稍后再试,或者打开网络代理。包括:将Ollama添加为启动服务。--verbose 显示统计信息。每次回复后都会显示统计。最新版本0.20.7。Ollama中文文档。

#ubuntu
win11 安装 Claude Code

本文介绍了ClaudeCode的安装与使用指南。主要内容包括:1) 提供官方文档和VSCode插件链接;2) 详细说明Windows、macOS和Linux系统的安装命令;3) 解决安装过程中可能出现的区域限制问题(需设置代理);4) 配置环境变量和模型设置方法;5) 演示基本使用流程,包括项目目录创建和交互式操作;6) 说明如何通过配置文件切换不同API服务(如Deepseek、阿里云百炼)。文

文章图片
ubuntu conda 安装vllm

本文介绍了如何安装最新稳定版vLLM及其CUDA 13.1依赖。首先激活conda环境,然后通过清华镜像源安装最新版vLLM,并指定CUDA 13.1的额外索引URL。安装完成后,可通过Python命令验证vLLM版本,预期输出为vLLM版本:0.18.0。整个过程包括环境准备、软件安装和版本验证三个步骤。

#ubuntu#conda
vllm 安装

建议在WSL2的Ubuntu中安装vLLM以避免Windows兼容性问题。安装方法:通过阿里云镜像pip install vllm,验证版本后即可使用。主要命令vllm serve支持加载HuggingFace模型或本地路径,可配置张量并行(多GPU)、上下文长度(如32K tokens)和量化选项(如GPTQ-int4)。典型用例包括:32B大模型需2个GPU并行,7B小模型单GPU运行。关键参

LM Studio 0.4.10 安装完,不显示显卡信息

本文介绍了模型加载参数设置问题及解决方案。当GPU Offload默认为0且在硬件设置不显示显卡信息时,建议在Runtime中安装CUDA。针对Windows系统下的llama.cpp使用Nvidia显卡加速,需确保安装CUDA12.8加速引擎。同时提到在0.4.9版本中,Harmony和CUDA 12 llama.cpp库会被默认下载安装。

文章图片
#LM Studio
deepseek 关闭思考,在ollama中,在代码中

deepseek 关闭思考,在ollama中,在代码中

langchain ModuleNotFoundError: No module named ‘langchain.chains‘

(aid) C:\Users\admin>pip install langchain (最新版本是1.0.1)

    共 76 条
  • 1
  • 2
  • 3
  • 8
  • 请选择