logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

全国大学生智能车竞赛-四轮摄像头组项目源码解析

计算机视觉是人工智能的一个重要分支,它涉及到通过算法和模型从图像或视频中提取信息、进行处理和分析,进而理解视觉世界。这项技术的重要性在于其应用范围广,从自动化监控系统、自动驾驶汽车到医疗影像分析等,计算机视觉技术都起着核心作用。它使得机器能够像人类一样解读和理解周围的视觉环境,为各种智能应用提供基础数据支撑。深度学习框架如TensorFlow和PyTorch为开发者提供了构建和训练深度神经网络的工

5分钟搭建大模型API网关:支持ChatGLM/文心一言/通义千问等主流模型

本文介绍了如何在星图GPU平台上自动化部署支持标准OpenAI API格式的大模型API网关镜像,开箱即用对接ChatGLM、文心一言、通义千问等主流模型。用户可快速构建统一API入口,典型应用于多模型协同的智能客服、内容生成与研发提效场景,显著降低接口适配成本。

Qwen3-ASR-1.7B多语言识别实测:支持30种语言+22种方言,效果如何?

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-1.7B大模型驱动的语音识别镜像,实现高效的多语言语音转文字功能。该模型支持30种语言和22种中文方言,特别适用于跨国会议实时转录、方言节目字幕生成等场景,显著提升语音识别效率与准确性。

#语音识别
DAMOYOLO-S多场景落地:支持RESTful API扩展,无缝对接IoT边缘设备

本文介绍了如何在星图GPU平台上自动化部署DAMOYOLO-高性能通用检测模型-S镜像,快速构建支持RESTful API的目标检测服务。该方案能无缝对接IoT边缘设备,实现如智能货架库存监控、工业零件缺陷初筛等典型应用场景,大幅降低视觉AI的落地门槛。

#目标检测#边缘计算
小白必看:Qwen3-ForcedAligner一键部署与使用指南

本文介绍了如何在星图GPU平台上一键自动化部署Qwen3-ForcedAligner镜像,实现高效的语音识别与时间戳对齐功能。该工具能够自动处理音频文件,精确标注每个词语的时间位置,广泛应用于字幕制作、会议记录整理和语言学习等场景,大幅提升音频内容处理效率。

#语音识别
零基础入门:手把手教你使用Qwen3-ASR-1.7B语音识别

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-1.7B语音识别镜像,实现高精度中文方言与嘈杂环境下的语音转文字。用户无需配置环境或编写代码,上传音频文件即可在30秒内获得带时间戳的准确文字稿,广泛适用于会议记录、采访整理和播客文稿生成等场景。

#语音识别
Jetson Nano边缘设备尝试部署小型IndexTTS2模型

在Jetson Nano上成功部署轻量级中文语音合成模型IndexTTS2,实现低延迟、离线、带情感表达的本地化语音输出。结合硬件特性与模型优化,探索边缘计算在语音交互中的实际应用价值。

灵毓秀-牧神-造相Z-Turbo保姆级入门:从部署到生成第一张古风图

本文介绍了如何在星图GPU平台上一键自动化部署“灵毓秀-牧神-造相Z-Turbo”镜像,快速开启AI古风绘图。该平台简化了部署流程,用户通过Web界面输入提示词,即可轻松生成符合《牧神记》原著设定的灵毓秀角色图像,适用于小说配图、游戏角色设计等创意场景。

Qwen Pixel Art企业落地案例:独立游戏工作室如何用它降本提效做美术资产

本文介绍了如何在星图GPU平台上自动化部署Qwen-Image-2512 + Pixel Art LoRA镜像,快速搭建像素艺术生成服务。该方案能高效生成风格统一的游戏美术资产,例如为独立游戏批量制作物品图标和环境贴图,显著降低美术生产成本并提升开发效率。

#游戏开发
Qwen3-ForcedAligner-0.6B效果展示:播客嘉宾姓名首次出现时间自动标记

本文介绍了如何在星图GPU平台自动化部署Qwen3-ForcedAligner-0.6B镜像,实现播客音频中嘉宾姓名首次出现时间的自动标记功能。该工具通过双模型架构提供毫秒级精度的时间戳对齐,显著提升播客制作、会议记录等场景的内容检索和剪辑效率。

#语音识别
    共 326 条
  • 1
  • 2
  • 3
  • 33
  • 请选择