
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了如何在星图GPU平台上自动化部署SGLang-v0.5.6镜像,快速搭建高性能大语言模型推理环境。该镜像通过RadixAttention技术显著提升多轮对话速度,支持结构化输出,适用于智能客服、内容生成等场景,帮助开发者高效实现复杂语言任务。
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。
基础教程类,为Hermes Agent用户提供接入指南,说明如何在Hermes的配置中指定custom提供方,并正确设置base_url后缀以及将Taotoken的API密钥填入约定的环境变量文件,完成智能体与多模型平台的连接。Hermes Agent是一个流行的智能体开发框架,它支持通过多种模型提供方来驱动智能体的推理与执行。当开发者希望使用Taotoken平台聚合的多种大模型时,可以通过配置H
本文介绍了如何在星图GPU平台上自动化部署【ollama】QwQ-32B镜像,实现低资源环境下的AI应用。通过该平台,用户可轻松在树莓派等边缘设备上运行量化版QwQ-32B模型,适用于本地数据处理的场景,如智能温室中的传感器数据分析和自然语言报告生成。
本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-0.6B镜像,构建低延迟实时语音识别服务。该方案基于WebSocket协议,适用于视频会议实时字幕生成等场景,支持52种语言识别,平均延迟控制在650ms以内,显著提升语音交互效率。
本文介绍了如何在星图GPU平台上自动化部署Fun-ASR-MLT-Nano-2512语音识别模型(二次开发构建by113小贝),实现从医疗问诊录音到结构化电子病历的自动生成。该方案能有效将医生与患者的对话录音转换为文字,并通过大语言模型提取关键信息,生成标准病历格式,从而显著提升诊疗文书工作的效率与规范性。
本文介绍了如何在星图GPU平台上,通过自动化部署“星图平台快速搭建 Clawdbot:私有化本地 Qwen3-VL:30B 并接入飞书(上篇)”镜像,快速搭建私有化多模态大模型环境。该镜像集成了强大的Qwen3-VL:30B模型,用户可轻松实现图文对话、图片内容识别与描述等核心应用,为后续接入办公平台奠定基础。
本文介绍了如何在星图GPU平台上自动化部署⚡ SenseVoice-Small ONNX语音识别工具镜像,实现高效的嵌入式语音识别应用。该方案支持将轻量级语音模型移植到STM32等设备,典型应用于智能家居的语音命令控制,为用户提供实时、低功耗的语音交互体验。
本文介绍了如何在星图GPU平台上自动化部署DeepSeek-R1-Distill-Qwen-1.5B镜像,实现轻量级语言模型的快速应用。该模型通过知识蒸馏技术优化,适用于边缘计算场景,如移动端智能助手和教育科研实验,提供高效的文本生成和代码编写能力。
本文介绍了如何在星图GPU平台上自动化部署🧠 DeepSeek-R1 (1.5B)本地逻辑推理引擎,实现高效、安全的本地AI推理。该镜像特别适用于处理敏感数据的场景,如企业知识管理、个人隐私保护等,通过本地化部署确保数据安全并降低延迟。







