logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

轻量级部署首选:GLM-4.7-Flash模型性能全解析

本文介绍了如何在星图GPU平台上一键自动化部署轻量级大模型【ollama】GLM-4.7-Flash,并解析其核心性能。该平台简化了部署流程,用户可快速利用该模型进行高效的代码生成、技术文档编写等AI辅助开发任务,显著提升开发效率。

Qwen-Image-Edit-F2P光照逻辑验证:金色阳光方向与阴影投射物理合理性

本文介绍了如何在星图GPU平台自动化部署Qwen-Image-Edit-F2P人脸生成图像开箱即用镜像,实现高质量AI图像生成。该镜像特别适用于生成具有合理光照效果的人脸图像,如根据用户指定的金色阳光方向自动生成符合物理规律的阴影投射,提升图片真实感和创作效率。

GLM-4-9B-Chat-1M部署教程:NVIDIA驱动+cuDNN+FlashAttention适配指南

本文介绍了如何在星图GPU平台上自动化部署GLM-4-9B-Chat-1M镜像,实现高效的长文本AI对话功能。该平台简化了NVIDIA驱动、CUDA和cuDNN等复杂环境配置,用户可快速搭建支持超长上下文处理的AI助手,典型应用于一次性分析和总结长达200万字的法律合同、企业财报等长文档。

GLM-4-9B-Chat-1M Chainlit低延迟优化:WebSocket压缩、流式chunk合并策略

本文介绍了如何在星图GPU平台上自动化部署【vllm】glm-4-9b-chat-1m镜像,实现低延迟、高流畅度的中文对话交互。通过WebSocket压缩与流式chunk智能合并策略,显著优化Chainlit前端响应体验,适用于智能客服、技术问答等实时对话场景,首字延迟降至1.18秒。

DeepSeek-OCR-2一文详解:如何用LoRA微调DeepSeek-OCR-2适配垂直领域

本文介绍了如何在星图GPU平台上自动化部署DeepSeek-OCR-2镜像,高效实现垂直领域文档的高精度OCR识别。通过LoRA微调,该模型可精准提取合同、医疗报告、施工日志等专业文档中的关键字段(如‘甲方’‘有效期至’‘施工部位’),显著提升结构化信息抽取准确率。

QWEN-AUDIO语音评测:内置MOS打分接口,支持生成效果自动评估

本文介绍了如何在星图GPU平台上自动化部署QWEN-AUDIO | 智能语音合成系统Web镜像,实现语音合成效果的实时MOS自动评估。用户可快速生成带情感指令的语音内容,并获得清晰度、自然度等四维评分,典型应用于电商口播质检、A/B情感指令对比及语音模型迭代验证。

Qwen-Ranker Pro API安全设计:认证、限流与审计

本文介绍了如何在星图GPU平台上自动化部署Qwen-Ranker Pro: 智能语义精排中心Web镜像,实现企业级API安全防护。该镜像提供智能语义重排服务,通过JWT认证、请求限流和操作审计等功能,保障API接口安全,适用于企业核心数据的语义搜索和重排场景。

Ollama+ChatGLM3-6B-128K:开源大模型高效推理实操手册

本文介绍了如何在星图GPU平台自动化部署【ollama】ChatGLM3-6B-128K镜像,实现高效开源大模型推理。该镜像专长于处理长达128K上下文的长文本任务,可应用于技术文档总结、代码解释与生成等场景,显著提升长文档分析与智能问答效率。

GLM-4.7-Flash性能实测:轻量级部署的30B模型有多强?

本文介绍了如何在星图GPU平台上自动化部署【ollama】GLM-4.7-Flash镜像,充分发挥其轻量级30B MoE架构优势。该模型可在单卡A10/L40S等消费级GPU上稳定运行,典型应用于科研辅助问答、代码生成与技术文档编写等高逻辑性文本生成任务,显著提升工程研发效率。

LLaMA-Factory 合并 LoRA 适配器到基础模型

通过 LLaMA-Factory 将训练好的 LoRA 适配器合并到 Qwen2.5-VL-7B 基础模型中,生成可独立部署的完整模型。需使用未量化权重,支持多文件分片导出,适用于图文多模态场景。

#LLaMA-Factory
    共 472 条
  • 1
  • 2
  • 3
  • 48
  • 请选择