KI-LK 个人主页

@weixin_44932725

KI-LK

2023-08-16 16:49:01 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

vLLM推理框架下跑Qwen3.5-9B及本地openai调用

本文介绍了使用vLLM推理框架运行Qwen3.5-9B大模型并进行本地OpenAI调用的完整流程。内容包括环境配置、vLLM离线批量推理实现、本地模型服务部署以及OpenAI方式调用验证。重点讲解了如何通过vLLM启动本地模型服务，包括单卡/多卡部署、显存优化策略，并提供了curl和Python两种测试方法。最终实现了一个私有化的OpenAI API服务，可兼容各种AI框架调用。该方案为大模型本地

#python #人工智能 #自然语言处理 +1

vLLM推理框架下跑Qwen3.5-9B及本地openai调用

#python #人工智能 #自然语言处理 +1

深度学习中GPU版本及使用情况查询

#深度学习 #人工智能

英伟达开源VLA模型Alpamayo-R1-10B介绍

英伟达开源了Alpamayo-R1-10B模型，这是一个基于Transformer架构的视觉语言动作(VLA)模型，专为自动驾驶场景设计，特别擅长处理罕见的长尾事件。该模型包含82亿参数的主干网络和23亿参数的动作专家模块，支持多摄像头输入(4个视角)和10Hz频率采集的轨迹数据。输出包括文本推理轨迹和未来6.4秒的预测轨迹。模型训练使用了超过10亿张图像和80,000小时驾驶数据，在Physic

#开源 #自动驾驶 #人工智能

MAC上采用Transformers官方库对Qwen3.5-27B模型进行推理

本文介绍了在Mac系统上使用Transformers库对Qwen3.5-27B大模型进行推理的环境配置和实现方法。主要内容包括：1) 推荐使用Python 3.11、PyTorch 2.6和最新版Transformers库的环境配置；2) 通过conda创建环境并安装核心依赖的详细步骤；3) 提供了完整的非量化版模型推理代码示例；4) 特别指出在macOS上GPTQ量化方案存在重大限制，虽然可以安

#macos #python #语言模型 +4

MAC上采用Transformers官方库对Qwen3.5-27B模型进行推理

#macos #python #语言模型 +4

‘MNIST’数据集报错解决方法

**'MNIST’数据集报错解决方法**问题一：在TensorFlow中，当库scikit-learn的版本在0.2及以上时或者在0.2以下时，MNIST数据集的导入方法：解决：在0.2X版本中使用：from sklearn.datasets import fetch_openmlmnist=fetch_openml('MNIST Original)在0.2以下版本中使用：from sklearn

#python #tensorflow

深度学习中GPU版本及使用情况查询

#深度学习 #人工智能

到底了