logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

小白必看:用Ollama一键运行DeepSeek-R1的完整避坑指南

本文介绍了基于星图GPU平台,如何自动化部署🧠 DeepSeek-R1 (1.5B) - 本地逻辑推理引擎镜像。该模型专精于数学计算与多步逻辑推理,适用于教育辅导、代码生成及AI应用开发等场景,结合Ollama实现一键本地运行,兼顾隐私安全与高效推理。

codex的效率命令结合vLLM,编程效率提升80%

通过将codex类效率命令与vLLM高性能推理引擎结合,利用PagedAttention和连续批处理技术,显著提升代码生成速度与并发能力。实测显示任务耗时下降近80%,单节点吞吐提升5-10倍,可在消费级显卡部署,降低企业AI编程平台构建成本。

#vLLM
GLM-4v-9b保姆级指南:WebUI中自定义系统提示词提升中文图表理解精度

本文介绍了如何在星图GPU平台上自动化部署GLM-4v-9b镜像,并利用其WebUI自定义系统提示词,以显著提升模型对中文图表(如商业报告、数据可视化)的理解与分析精度。通过这一方法,用户可快速将模型调校为专业的数据分析助手,高效处理本地多模态任务。

GLM-4-9B-Chat-1M参数解析:从模型架构到推理优化

本文介绍了如何在星图GPU平台上自动化部署【vllm】glm-4-9b-chat-1m镜像,高效支撑超长上下文(最高100万token)的法律/金融文档分析任务。通过预置优化参数配置,用户可快速实现合同条款提取、长文档摘要生成等典型场景,显著提升专业文本处理的准确性与响应效率。

Llama-3.2-3B模型低精度推理指南:FP16与INT8对比

本文介绍了如何在星图GPU平台自动化部署【ollama】Llama-3.2-3B镜像,实现高效低精度推理。通过对比FP16与INT8精度,该镜像在减少内存占用和提升推理速度的同时,仍能保持良好的文本生成质量,适用于构建智能对话、内容创作等AI应用场景。

GLM-4v-9b入门必看:中英双语视觉问答+高分辨率输入快速上手

本文介绍了如何在星图GPU平台上自动化部署GLM-4v-9b镜像,快速启用中英双语视觉问答能力。依托高分辨率(1120×1120)原生支持与端到端图文对齐架构,该镜像可精准解析Excel截图、PDF扫描件等中文办公图像,典型应用于成绩单数据提取、发票信息识别等真实场景。

ollama部署DeepSeek-R1-Distill-Qwen-7B:解决常见问题指南

本文介绍了如何在星图GPU平台上一键自动化部署【ollama】DeepSeek-R1-Distill-Qwen-7B镜像,并解决常见部署问题。该镜像适用于代码生成和数学推理等文本生成任务,能帮助开发者在资源受限环境下高效构建AI应用。

Qwen-Ranker Pro开箱体验:搜索结果优化原来这么简单

本文介绍了如何在星图GPU平台自动化部署Qwen-Ranker Pro: 智能语义精排中心Web镜像,实现智能搜索优化。该工具基于先进的语义理解技术,可快速提升企业知识库、电商平台等场景的搜索结果准确性和相关性,让用户轻松获得更精准的检索体验。

智谱AI GLM-Image WebUI保姆级教程:从模型下载到图像保存全流程

本文介绍了如何在星图GPU平台自动化部署智谱AI GLM-Image WebUI镜像,实现文本生成图像功能。该平台简化了部署流程,用户可通过Web界面输入文本描述快速生成高质量图片,适用于创意设计、内容创作和社交媒体配图等场景,大幅降低AI绘画的使用门槛。

DeepSeek-OCR-2多格式支持:深求·墨鉴PDF扫描件→可搜索PDF生成教程

本文介绍了如何在星图GPU平台上自动化部署🖋️ 深求·墨鉴 (DeepSeek-OCR-2)镜像,实现PDF扫描件到可搜索PDF的智能转换。该工具能精准识别扫描文档中的文字和排版,生成可编辑、可搜索的智能PDF,适用于文档数字化、档案管理等场景,显著提升办公效率。

    共 492 条
  • 1
  • 2
  • 3
  • 50
  • 请选择