logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

通过taotoken为ubuntu上的hermes agent配置自定义大模型提供方

基础教程类,本文详细讲解如何在 Ubuntu 系统中为 Hermes Agent 配置 Taotoken 作为 custom 提供方,步骤包括按文档要求设置 provider 与 base url,以及将密钥写入约定的环境变量文件,确保 agent 能通过 Taotoken 稳定调用所需模型。

Qwen3-ASR-1.7B流式推理教程:实时语音转写实现方案

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-1.7B镜像,实现流式语音识别功能。该方案支持实时音频转写,可应用于视频会议字幕生成、直播实时字幕等场景,显著提升语音处理的效率和用户体验。

#语音识别
零基础教程:用Qwen3-ASR快速搭建本地语音识别工具

本文介绍了如何在星图GPU平台上自动化部署Qwen/Qwen3-ASR-0.6B镜像,快速构建本地语音识别工具。用户无需配置环境,即可实现会议录音、采访音频等中文多语混合场景下的高精度实时转写,兼顾隐私安全与操作便捷性。

#语音识别
基于GMM-HMM的传统语音识别对比

本文深入解析基于GMM-HMM的传统语音识别技术,介绍其声学模型与语言模型的协同机制,探讨高斯混合模型和隐马尔可夫模型在语音特征建模与时序推理中的作用,并分析其在小数据、嵌入式场景下的应用价值。

小智AI音箱语音识别接口API封装与调用实例

小智AI音箱语音识别技术解析,涵盖API设计、多平台SDK封装、性能优化及未来语义理解与边缘云协同发展方向。

#语音识别
利用ms-swift进行多模态大模型Qwen3-VL训练的最佳实践

借助ms-swift框架高效训练多模态大模型Qwen3-VL,支持QLoRA、Packing和FlashAttention-3等技术,显著降低显存消耗并提升训练速度。从数据准备、分布式策略到GRPO对齐与一键部署,实现全流程自动化,让复杂模型落地更简单。

Qwen3-ASR语音识别优化升级:使用vLLM后端提升识别性能

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR语音识别镜像,并利用vLLM后端优化其性能。通过简单的配置切换,用户即可显著提升语音识别的并发处理能力和稳定性,适用于会议记录、客服质检等需要高效音频转文字的实际场景。

#语音识别
[特殊字符] Nano-Banana效果对比:不同CFG下部件数量一致性与命名准确率分析

本文介绍了如何在星图GPU平台上自动化部署🍌 Nano-Banana 产品拆解引擎镜像,实现高精度电子产品结构化拆解图生成。该镜像专为工业级应用设计,可稳定输出部件数量一致、命名准确、布局规整的Knolling风格拆解图,广泛应用于BOM核验、维修手册制作与供应链可视化等场景。

通义千问2.7B-Instruct部署避坑指南:端口冲突解决方案

本文介绍了如何在星图GPU平台上自动化部署通义千问2.5-7B-Instruct镜像,并解决常见的端口冲突问题。该镜像支持128K长文本处理和代码生成,可应用于智能问答、文档分析等场景,帮助用户快速搭建高效的大语言模型服务环境。

通义千问1.5-1.8B-Chat-GPTQ-Int4 WebUI开发:Node.js后端服务调用实战

本文介绍了如何在星图GPU平台上自动化部署通义千问1.5-1.8B-Chat-GPTQ-Int4 WebUI镜像,并利用Node.js构建后端服务调用其AI能力。通过搭建代理服务器,开发者可以轻松将该大语言模型集成到智能客服、问答助手等应用场景中,实现工程化落地。

    共 315 条
  • 1
  • 2
  • 3
  • 32
  • 请选择