logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

OpenClaw+千问3.5-9B:学术论文阅读助手

本文介绍了如何在星图GPU平台上自动化部署千问3.5-9B镜像,构建学术论文阅读助手。该系统能自动处理PDF文献,生成结构化笔记,帮助研究者高效筛选关键论文,节省70%的文献处理时间。典型应用场景包括每日自动抓取预印本论文并生成学术简报,特别适合需要跟踪跨领域研究进展的学者。

Qwen3-4B-Thinking-GGUF部署案例:vLLM服务与Prometheus+Grafana可观测性集成

本文介绍了如何在星图GPU平台上自动化部署Qwen3-4B-Thinking-2507-GPT-5-Codex-Distill-GGUF镜像,并构建一个完整的AI服务与监控系统。通过vLLM部署该模型提供高效的文本生成与推理服务,并集成Prometheus与Grafana实现服务的实时性能监控与可观测性,确保AI应用稳定运行。

Super Qwen Voice World实现智能会议纪要生成

本文介绍了如何在星图GPU平台上自动化部署超级千问:语音设计世界(Super Qwen Voice World)镜像,实现智能会议纪要生成。该镜像通过多说话人分离和自然语言处理技术,能够自动识别会议关键信息、提取任务项并生成结构化纪要,显著提升会议效率,适用于日常站会、项目评审等多种商务场景。

#语音识别#自然语言处理
南北阁 Nanbeige 4.1-3B 部署案例:高校AI通识课实验平台——百人并发轻量部署方案

本文介绍了如何在星图GPU平台上自动化部署南北阁 Nanbeige 4.1-3B镜像,以构建一个支持百人并发的高校AI通识课实验平台。该方案通过轻量化架构与流式输出优化,使学生能实时体验大模型对话,有效解决了教学场景中高并发、低成本与良好体验的平衡难题。

Web端实时字幕生成系统:Qwen3-ASR-0.6B+WebRTC技术实现

本文介绍了如何在星图GPU平台自动化部署Qwen/Qwen3-ASR-0.6B镜像,构建Web端实时字幕生成系统。该系统利用WebRTC技术实现音频采集,在浏览器本地完成语音识别,典型应用于在线会议和视频直播场景,提供低延迟、高隐私保护的实时字幕服务。

#语音识别
VibeVoice Pro镜像免配置部署实战:Docker Compose一键拉起7860控制台

本文介绍了如何在星图GPU平台上,通过Docker Compose一键自动化部署VibeVoice Pro:零延迟流式音频引擎镜像,快速搭建实时语音合成服务。该镜像采用音素级流式处理技术,能实现边输入文本边生成语音,典型应用于为视频内容、智能助手等场景提供低延迟、高自然度的实时配音。

从STM32采集到云端识别:SenseVoice-Small在嵌入式音频处理链中的应用

本文介绍了如何利用星图GPU平台,自动化部署sensevoice-small-语音识别-onnx模型(带量化后)镜像,构建嵌入式语音识别系统。该方案将STM32采集的音频数据发送至云端,由SenseVoice-Small模型完成高精度语音转文字,典型应用于智能家居的语音指令识别与控制场景。

#语音识别
LiuJuan20260223Zimage从零开始:个人LoRA模型部署到社交平台头像批量生成实战

本文介绍了如何在星图GPU平台自动化部署LiuJuan20260223Zimage镜像,快速生成个性化社交头像。该镜像基于LoRA技术,用户只需输入文本描述即可批量生成多种风格的头像图片,大幅提升社交媒体内容创作效率。

#LoRA模型
Qwen3-ASR-1.7B效果实测:复杂场景下的语音转写

本文介绍了如何在星图GPU平台上自动化部署🎙️ Qwen3-ASR-1.7B 高精度语音识别工具镜像,高效实现复杂场景下的语音转文字任务。该镜像支持中英混合、多人交叉发言及低信噪比音频的高保真转写,典型应用于技术会议记录、视频字幕生成与教学录音整理,显著提升专业内容处理效率。

#语音识别
静音片段自动过滤:提升后续处理效率

音频中的静音片段会浪费计算资源并影响识别准确率。Fun-ASR通过智能语音活动检测(VAD)技术,自动切分并剔除无效静音段,显著缩短处理时间、降低显存占用,同时减少模型误识别。该技术已在实际转写任务中验证有效,尤其适用于长录音场景。

    共 346 条
  • 1
  • 2
  • 3
  • 35
  • 请选择