logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

解决Claude Code访问不稳定问题并配置Taotoken接入

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

Ollama部署本地大模型|translategemma-12b-it政务外宣图文翻译安全沙箱部署

本文介绍了如何在星图GPU平台上自动化部署【ollama】translategemma-12b-it镜像,实现高效的本地化图文翻译。该方案特别适用于政务外宣场景,能够安全、准确地进行多语言图文翻译,确保数据不出域,满足政务内容对外传播的精准性和安全性要求。

#Ollama
Qwen3-32B部署实操:Clawdbot网关+Ollama构建AI能力开放平台

本文介绍了如何在星图GPU平台自动化部署Clawdbot整合Qwen3:32B代理直连Web网关配置Chat平台镜像,快速构建企业级AI能力开放平台。该方案支持私有化部署大语言模型,适用于智能客服、内容生成等场景,保障数据安全的同时提升企业AI应用效率。

vLLM镜像支持哪些模型?LLaMA、通义千问、ChatGLM全适配

vLLM是一款高性能大语言模型推理引擎,支持LLaMA、通义千问、ChatGLM等主流开源模型,并兼容GPTQ、AWQ等量化格式。通过PagedAttention和连续批处理技术,显著提升显存利用率和推理吞吐量,降低部署成本,适用于高并发AI服务场景。

#vLLM
手把手教你用Qwen2.5-0.5B搭建本地智能客服(附完整代码)

本文介绍了如何在星图GPU平台上自动化部署🤖Qwen2.5-0.5B Instruct镜像,快速构建本地化智能客服系统。依托该轻量级大模型,用户可在普通游戏本上实现低延迟、多轮上下文理解的实时对话服务,典型应用于企业内部客服问答、退货政策咨询与产品FAQ生成等场景,全程数据不出本地,兼顾隐私性与实用性。

SGLang究竟是什么?一文讲清它的核心优势与用途

本文介绍了如何在星图GPU平台上自动化部署SGLang-v0.5.6镜像,实现高效的大语言模型推理与结构化输出。基于该平台,用户可快速搭建AI Agent应用,典型场景如手机自动化操作中的指令生成与执行,显著提升任务处理效率与系统可靠性。

Hunyuan-MT-7B与IDEA插件开发:代码注释实时翻译

本文介绍了如何在星图GPU平台上自动化部署Hunyuan-MT-7B镜像,实现IDEA插件中的代码注释实时翻译功能。开发者可快速启用轻量级多语言翻译能力,显著提升跨国开源项目阅读、遗留系统维护及多语言协作效率。

MedGemma-X插件开发指南:基于VSCode的医疗AI扩展工具

本文介绍了如何在星图GPU平台上自动化部署🛸 MedGemma-X镜像,实现智能医疗影像分析。该平台支持快速搭建医疗AI开发环境,通过VSCode插件集成,开发者可直接在编辑器中分析DICOM影像、生成诊断报告,提升医疗影像诊断效率。

AudioLDM-S音效生成:Typora插件开发实战

本文介绍了如何在星图GPU平台上自动化部署AudioLDM-S (极速音效生成)镜像,实现AI音效生成功能。通过该平台,用户可快速搭建音效生成环境,应用于文档创作、视频制作等场景,为内容添加高质量的环境音效和提示音,提升多媒体内容的沉浸感和表现力。

初次使用Taotoken Token Plan套餐对项目成本的优化感受

回顾这次从按量计费切换到Token Plan套餐的经历,我们认为其带来的“优化感受”主要体现在规划性和心理层面,而非技术层面。从规划性上看,它帮助我们将一个可变成本部分转化为固定成本,使得项目在特定阶段内的模型调用预算变得明确。这对于需要向管理者汇报预算执行情况,或是对个人开发者管理月度开支而言,是一个实用的工具。从心理层面看,它降低了在开发迭代过程中对成本的持续焦虑感。开发者可以更专注于功能实现

    共 379 条
  • 1
  • 2
  • 3
  • 38
  • 请选择