logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

SenseVoice REST API使用详解:快速集成语音识别功能

本文介绍了如何在星图GPU平台上自动化部署sensevoice-small-语音识别-onnx模型(带量化后)镜像,实现高效语音识别功能。该镜像支持多语言音频转写,可快速集成到智能客服、会议记录等应用场景,显著提升语音处理效率与准确性。

#语音识别
SiameseUIE在计算机网络日志分析中的应用

本文介绍了如何在星图GPU平台自动化部署SiameseUIE模型部署镜像,实现计算机网络日志的智能分析。该方案能够从非结构化日志中自动提取关键实体与关系,快速定位网络故障、检测安全威胁,显著提升运维效率与准确性。

阿里开源MGeo模型部署案例:单卡4090D快速上手指南

本文介绍了基于星图GPU平台自动化部署MGeo地址相似度匹配实体对齐-中文-地址领域镜像的完整流程。通过该平台,用户可在单卡4090D上快速实现模型推理,适用于地址标准化、实体对齐等典型AI应用开发场景,显著提升本地生活服务与城市计算中的数据处理效率。

国产操作系统兼容性:统信UOS、麒麟系统实测

统信UOS与银河麒麟环境下,Fun-ASR WebUI实现本地化语音转文字,无需联网、保护隐私,支持VAD分割、热词增强与批量处理,适配x86和ARM架构,政务、教育场景高效可用。

#语音识别
Fun-ASR文本规整(ITN)实测:‘二零二五年‘变‘2025年‘

本文介绍了如何在星图GPU平台上自动化部署Fun-ASR钉钉联合通义推出的语音识别大模型语音识别系统 构建by科哥镜像,实现语音转写后的智能文本规整(ITN)。该镜像可将口语化数字表达(如'二零二五年')自动转换为标准书面格式(如'2025年'),广泛应用于会议纪要生成、合同文本校对等正式文档场景。

#语音识别
SAM 3实战教程:结合Gradio构建私有化可提示分割Web工具

本文介绍了如何在星图GPU平台自动化部署SAM 3图像和视频识别分割镜像,快速构建私有化可提示分割Web工具。该工具支持通过文本、点、框等多种提示方式,实现对图像和视频中特定物体的智能识别与分割,可广泛应用于电商商品提取、视频内容编辑等场景,提升视觉内容处理效率。

AI 净界科研辅助:RMBG-1.4作为计算机视觉预处理工具

本文介绍了如何在星图GPU平台上自动化部署AI净界 - RMBG-1.4镜像,实现高效的图像背景移除。该工具作为计算机视觉预处理利器,能够精准处理复杂边缘,为后续的图片生成、3D重建或数据标注等任务提供高质量的前景主体,显著提升科研与工程效率。

#计算机视觉
告别PS抠图烦恼:AI净界RMBG-1.4实测效果惊艳,毛发细节完美保留

本文介绍了如何在星图GPU平台上自动化部署AI 净界 - RMBG-1.4镜像,实现高精度图像背景去除。该镜像专为毛发、半透明材质等复杂边缘优化,可一键完成人像发丝、宠物毛绒、玻璃杯等场景的高质量抠图,广泛应用于电商主图制作与AI贴纸生成。

Qwen3-ASR-0.6B效果展示:52种语言实时识别对比

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-0.6B镜像,实现52种语言及方言的实时语音识别。该镜像可直接应用于跨语言会议记录、多语种客服录音转写等典型场景,支持噪声环境下的高精度流式识别与毫秒级时间戳输出,显著提升语音处理效率与准确性。

#语音识别
Youtu-VL-4B-Instruct环境部署:CSDN星图镜像+Supervisor自动启停教程

本文介绍了如何在星图GPU平台上自动化部署Youtu-VL-4B-Instruct多模态视觉语言模型(腾讯优图),并利用Supervisor实现服务的自动启停与管理。该模型能够理解图像内容并进行对话,典型应用场景包括电商领域的商品图片分析,例如自动识别商品属性、品牌并生成描述,从而提升内容处理效率。

    共 318 条
  • 1
  • 2
  • 3
  • 32
  • 请选择