
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
Qwen3-VL-32B 在昇腾服务器上的部署与性能调优实战:基于 vllm-ascend 的多模态推理优化实践
本文介绍了Qwen3-VL-32B 在昇腾910B上的使用vLLM-Ascend两种性能调优方法,以提高多模态模型在昇腾服务器上的性能

Milvus向量数据库批量导入数据
Milvus向量数据库的批量导入

最新模型Qwen3.5系列模型GGUF量化版本的部署与使用
最近千问新推出的Qwen3.5系列模型,实现了行业内一次重要的技术突破——它首次打破多模态模型与单独大语言模型的割裂壁垒,采用原生融合架构而非“拼装式”设计,将视觉感知与语言推理能力深度整合在统一技术基座中,彻底解决了传统多模态模型“模块脱节、协同性差”的痛点。

最新版YOLOv12安装秘籍:让目标检测变得前所未有的简单(附与YOLOv8版本对比)
yolov12安装配置以及与yolov8的对比

Qwen3-VL-32B 在昇腾服务器上的部署与性能调优实战:基于 vllm-ascend 的多模态推理优化实践
本文介绍了Qwen3-VL-32B 在昇腾910B上的使用vLLM-Ascend两种性能调优方法,以提高多模态模型在昇腾服务器上的性能

Qwen3-VL-32B 在昇腾服务器上的部署与性能调优实战:基于 vllm-ascend 的多模态推理优化实践
本文介绍了Qwen3-VL-32B 在昇腾910B上的使用vLLM-Ascend两种性能调优方法,以提高多模态模型在昇腾服务器上的性能

Qwen3-VL-32B 在昇腾服务器上的部署与性能调优实战:基于 vllm-ascend 的多模态推理优化实践
本文介绍了Qwen3-VL-32B 在昇腾910B上的使用vLLM-Ascend两种性能调优方法,以提高多模态模型在昇腾服务器上的性能

Ollama+Deepseek+chatbox快速部署属于自己的大模型
快速本地部署deep seek R1模型

Milvus向量数据库批量导入数据
Milvus向量数据库的批量导入

海康摄像头 + M7s(Monibuca) + FFmpeg + Python实现多个网络摄像头视频流推流
使用python多视频流推送monibuca服务器








