logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

利用Taotoken多模型聚合能力为你的智能客服系统注入活力

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

告别 Claude Code 封号与 Token 不足使用 Taotoken 稳定对接

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

在 Hermes Agent 项目中集成 Taotoken 作为自定义模型供应商

基础教程类,面向使用 Hermes Agent 框架的开发者,本文详细说明如何在配置文件中指定 provider 为 custom,并按要求设置 base_url 指向 Taotoken 的特定端点,同时将 API Key 写入 Hermes 约定的环境变量文件,完成自定义模型源的接入。Hermes Agent 是一个流行的 AI 应用开发框架,它内置了对多种模型供应商的支持。当开发者希望使用 T

ollama+LFM2.5-1.2B-Thinking:轻量级AI写作解决方案实战

本文介绍了如何在星图GPU平台自动化部署【ollama】LFM2.5-1.2B-Thinking镜像,实现轻量级AI写作功能。该镜像支持本地化文本生成,适用于技术文档撰写、创意写作和商务邮件等场景,提供高效、隐私安全的写作助手体验。

Step3-VL-10B多场景落地:AR眼镜实时画面理解+语音交互反馈生成

本文介绍了基于星图GPU平台,如何自动化部署Step3-VL-10B-Base阶跃星辰轻量级多模态基础模型,以实现AR眼镜的实时画面理解与语音交互。该方案的核心应用场景是智能导览,例如在博物馆中,AR眼镜能自动识别展品并生成个性化的语音讲解,为用户提供沉浸式的增强现实体验。

VibeVoice实时语音合成系统5分钟快速部署:一键启动WebUI保姆级教程

本文介绍了如何在星图GPU平台上自动化部署VibeVoice实时语音合成系统镜像,快速搭建AI语音生成环境。该平台简化了部署流程,用户可通过WebUI界面轻松将文本转换为高质量、低延迟的语音,典型应用场景包括为短视频、教育材料等内容快速生成配音,显著提升创作效率。

Qwen3-ASR-1.7B模型微调指南:适应特定领域语音识别需求

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-1.7B 语音识别模型v2,并对其进行微调以适应特定领域需求。通过该平台,用户可以便捷地搭建语音识别环境,将模型应用于如医疗问诊、会议记录等场景,有效提升专业领域语音转文字的准确率。

#语音识别
openclaw+ComfyUI+Nunchaku:三合一开源文生图技术栈落地实操

本文介绍了如何在星图GPU平台上自动化部署Nunchaku FLUX.1-dev文生图镜像,快速搭建开源AI绘画环境。该平台简化了部署流程,用户可轻松利用该镜像生成高质量图像,应用于创意设计、社交媒体内容制作等场景,显著提升视觉内容创作效率。

小白友好:Docker部署Qwen3-ASR-0.6B语音识别模型,附完整代码

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-0.6B语音识别镜像,实现高效语音转文本功能。该镜像支持快速搭建语音识别服务,适用于会议记录、语音助手等场景,通过Docker容器化技术简化部署流程,提升开发效率。

#语音识别
物流单据自动化:OCR镜像识别运单信息入库ERP系统

本镜像基于 ModelScope 开源平台的经典CRNN(Convolutional Recurrent Neural Network)模型构建,专为工业级中文 OCR 场景优化。相较于传统的 CNN+Softmax 轻量模型,CRNN 引入了循环神经网络(RNN)和 CTC(Connectionist Temporal Classification)损失函数,在处理连续字符序列时具备更强的上下文

    共 343 条
  • 1
  • 2
  • 3
  • 35
  • 请选择