logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

千问3.5-2B集成IDEA开发环境:Java大模型应用快速构建指南

本文介绍了如何在星图GPU平台上自动化部署千问3.5-2B镜像,快速构建Java大模型应用开发环境。通过集成IDEA,开发者可直接调用该模型实现智能代码注释生成、文本分类等任务,显著提升本地开发效率与响应速度。

通义千问1.5-1.8B-Chat-GPTQ-Int4在VSCode Python环境配置中的辅助

本文介绍了如何在星图GPU平台自动化部署通义千问1.5-1.8B-Chat-GPTQ-Int4镜像,该镜像可作为智能编程助手,辅助开发者快速解决VSCode中Python环境配置问题,如虚拟环境设置、依赖包安装和错误排查,显著提升开发效率。

通义千问2.5-0.5B显存溢出?低资源适配实战解决方案

本文介绍了基于星图GPU平台自动化部署通义千问2.5-0.5B-Instruct镜像的实战方案,针对低资源环境下显存溢出问题,提供量化压缩、PagedAttention优化等解决策略,适用于边缘设备上的模型微调与AI应用开发,实现高效稳定推理。

小白必看:通义千问3-14B的Thinking模式与Non-thinking模式对比测评

本文介绍了基于星图GPU平台自动化部署通义千问3-14B镜像的实践方法。该平台支持一键部署与高效运行,适用于模型微调、AI应用开发等场景。通过对比Thinking与Non-thinking模式,展现其在推理准确性与响应速度间的灵活平衡,助力开发者优化本地大模型应用体验。

PyTorch-CUDA-v2.7镜像是否支持ROCm?AMD显卡用户必看

标有CUDA的PyTorch镜像专为NVIDIA显卡设计,无法在AMD GPU上运行。AMD用户需使用rocm/pytorch专用镜像,并通过HIP接口调用GPU,同时注意驱动挂载与硬件兼容性问题。名称中的'cuda'具有误导性,实际依赖底层架构绑定。

SenseVoice Small政务热线应用:市民来电自动分类+诉求关键词提取

本文介绍了如何在星图GPU平台上自动化部署SenseVoice Small镜像,实现政务热线场景下的市民来电自动分类与诉求关键词提取。该镜像轻量高效,支持方言识别与多诉求解析,可快速构建语音处理流水线,显著提升12345热线工单初筛效率与结构化信息生成能力。

#语音识别
小白也能玩转语音识别:FunASR WebUI快速入门与使用全攻略

本文介绍了如何在星图GPU平台上自动化部署FunASR语音识别WebUI镜像,该镜像基于speech_ngram_lm_zh-cn二次开发构建。通过该平台,用户可快速搭建语音转文字服务,轻松应用于视频字幕制作、会议记录整理等场景,大幅提升音频内容处理效率。

#语音识别
Qwen3.5-2B轻量教程:关闭Flash Attention节省显存,适配4GB显卡

本文介绍了如何在星图GPU平台上自动化部署Qwen3.5-2B轻量化多模态基础模型,通过关闭Flash Attention功能显著降低显存占用至2.6GB,适配4GB显卡。该配置特别适合边缘计算设备部署和教学研究场景,在保持模型性能的同时大幅降低硬件门槛。

#边缘计算
Qwen3-ASR-1.7B跨平台部署:Windows+Linux双环境指南

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-1.7B镜像,实现高效的多语言语音识别。该平台简化了部署流程,用户可快速搭建环境,将模型应用于实时语音转文字、会议记录等场景,显著提升音频内容处理效率。

#语音识别
DASD-4B-Thinking性能对比:4B参数Long-CoT模型vs Qwen3-4B-Instruct实测分析

本文介绍了如何在星图GPU平台上自动化部署【vllm】 DASD-4B-Thinking镜像,该镜像是一个专精于长链式思维推理的4B参数模型。通过该平台,用户可以快速搭建环境,并利用该模型在数学解题、代码生成等需要多步逻辑推理的场景中,获得清晰、逐步的思考过程演示,提升学习与问题分析效率。

    共 347 条
  • 1
  • 2
  • 3
  • 35
  • 请选择