logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GLM-OCR部署案例:省级档案馆OCR集群部署——负载均衡+模型热更新方案

本文介绍了如何在星图GPU平台上自动化部署GLM-OCR镜像,实现高效的OCR文字识别集群服务。该方案特别适用于省级档案馆等机构,能够自动化处理海量历史文档的数字化识别任务,显著提升复杂排版和表格内容的识别准确率与处理效率。

GLM-4-9B-Chat-1M开源镜像实操:无需conda/pip,开箱即用vLLM服务

本文介绍了如何在星图GPU平台上自动化部署【vllm】glm-4-9b-chat-1m镜像,实现开箱即用的vLLM推理服务。该方案免去了复杂的conda/pip环境配置,用户可快速启动服务并通过Chainlit网页界面与模型交互,轻松应用于超长文本总结、多轮对话及代码生成等场景。

#vLLM
如何验证DeepSeek-R1-Distill-Qwen-1.5B服务是否成功?日志查看教程

本文介绍了在星图GPU平台上自动化部署DeepSeek-R1-Distill-Qwen-1.5B镜像的方法,并详细讲解了如何通过日志查看和服务验证确保模型成功运行。该镜像专为高效文本生成优化,适用于智能对话、内容创作等场景,帮助用户快速构建AI应用。

Ollama+translategemma-12b-it:制造业设备手册图文翻译知识库构建实践

本文介绍了如何在星图GPU平台上自动化部署【ollama】translategemma-12b-it镜像,实现制造业设备手册的智能图文翻译。该方案能高效处理英文技术文档,自动识别图片文本并翻译,显著提升设备手册的本地化效率和术语一致性,适用于工业设备维护、操作指南等场景的快速知识库构建。

#Ollama
惊艳效果展示:DeepSeek-R1-Distill-Qwen-7B文本生成实测案例

本文介绍了如何在星图GPU平台自动化部署【ollama】DeepSeek-R1-Distill-Qwen-7B镜像,实现高效文本生成。该模型专精于数学推理、代码生成与逻辑分析,能自动生成步骤清晰的解题过程、语法正确的代码及严谨的逻辑推导,显著提升教育辅助和技术文档撰写效率。

Qwen-Image-Lightning实战:生成水墨风格中国龙

本文介绍了如何在星图GPU平台上自动化部署⚡ Qwen-Image-Lightning镜像,快速生成AI绘画作品。该平台简化了部署流程,用户可利用该镜像,通过输入中文提示词,在几十秒内高效生成如“水墨风格中国龙”等具有东方美学特色的高清图片,极大提升了内容创作效率。

Qwen-Ranker Pro效果实测:多行业场景下的精排准确率报告

本文介绍了如何在星图GPU平台自动化部署Qwen-Ranker Pro: 智能语义精排中心Web镜像,实现智能语义精排功能。该镜像在电商商品搜索、金融风控审核等场景中表现出色,能够显著提升搜索结果的相关性和准确性,Top-3命中率高达92%以上,助力企业优化搜索与推荐体验。

GLM-4-9B-Chat-1M在Qt开发中的应用:跨平台GUI智能助手

本文介绍了如何在星图GPU平台自动化部署GLM-4-9B-Chat-1M镜像,实现跨平台GUI智能助手应用。该镜像支持长上下文理解和多语言对话,可集成于Qt开发环境,用于智能代码补全、技术文档分析等场景,显著提升开发效率与用户体验。

#AI助手
GLM-4.7-Flash步骤详解:修改max-model-len适配不同业务上下文需求

本文介绍了如何在星图GPU平台上自动化部署GLM-4.7-Flash镜像,并通过调整max-model-len参数来优化模型性能。该镜像专为处理长文本场景设计,能够高效完成客服对话分析、长篇文档总结等任务,帮助用户根据实际业务需求灵活配置上下文长度,提升大语言模型的应用效果。

1M上下文大模型应用:GLM-4-9B-Chat文本生成案例

本文介绍了如何在星图GPU平台自动化部署【vllm】glm-4-9b-chat-1m镜像,实现1M上下文长度的文本生成应用。该模型能高效处理超长文档,适用于技术文档分析、多语言商务沟通和代码生成等场景,大幅提升文本处理与创作效率。

    共 546 条
  • 1
  • 2
  • 3
  • 55
  • 请选择