logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Java文本转语音系统开发手册与源码实战

文本转语音(Text-to-Speech,简称TTS)技术是人工智能与语音处理领域的重要应用之一,广泛用于智能助手、无障碍阅读、语音播报等场景。在Java生态中,jTTS5(Java Text To Speech 5)作为一款功能强大的开源TTS系统,支持多语言、多发音人、可扩展架构,适用于企业级应用与嵌入式系统。其核心优势在于模块化设计、跨平台兼容性与高性能音频合成能力。本章将为读者建立对jTT

MidJourney智能客服海报设计案例

本文探讨MidJourney在智能客服海报设计中的应用,涵盖技术原理、视觉心理学、提示词优化及多行业实战案例,揭示AI辅助设计的全流程与未来趋势。

AIGlasses在视障辅助场景的应用:从物品查找到实时语音交互

本文介绍了如何在星图GPU平台上自动化部署AIGlasses_for_navigation可穿戴智能设备镜像,实现视障辅助功能。该平台简化了部署流程,用户可快速搭建环境,利用该镜像实现核心应用场景,如通过语音指令引导视障人士在超市中独立查找并拿取目标商品,提升生活自主性。

#计算机视觉
Qwen3-TTS语音设计实战:为元宇宙虚拟人构建多语种实时语音驱动系统

本文介绍了如何在星图GPU平台上一键自动化部署【声音设计】Qwen3-TTS-12Hz-1.7B-VoiceDesign镜像,快速构建多语种实时语音合成系统。该镜像专为元宇宙虚拟人设计,支持10种语言的情感化语音生成,适用于虚拟直播、实时对话等交互场景,显著提升虚拟角色的真实感和表现力。

ollama部署Phi-4-mini-reasoning步骤详解:轻量级模型的高性能推理实践

本文介绍了如何在星图GPU平台上自动化部署【ollama】Phi-4-mini-reasoning镜像,实现轻量级AI模型的快速应用。该平台简化了部署流程,用户可便捷地利用该镜像进行高性能的数学与逻辑推理任务,例如解答复杂的数学问题或进行代码分析,显著提升学习和开发效率。

实测SenseVoice:如何用ONNX量化模型实现高效语音识别

本文介绍了如何在星图GPU平台上一键自动化部署sensevoice-small-语音识别-onnx模型(带量化后),实现高效的语音转文字功能。该模型支持多语言识别和自动语言检测,可广泛应用于视频字幕生成、会议记录转写等场景,显著提升音频处理效率。

#语音识别
Qwen3-ASR-0.6B长音频处理:20分钟连续语音识别方案

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-0.6B镜像,实现长达20分钟连续语音的高效识别。该方案特别适用于会议记录、讲座转录等长音频处理场景,能自动识别多语言内容,提升语音转文本的准确性和效率。

#语音识别
阿里小云KWS模型在智能门锁中的语音识别应用

本文介绍了如何在星图GPU平台自动化部署阿里“小云”语音唤醒模型(KWS),实现智能门锁的语音识别功能。该模型支持本地化关键词检测,用户可通过语音指令(如“小云小云,打开门锁”)快速唤醒设备,提升智能家居交互的便捷性与安全性。

#语音识别
智能仓储管理:CRNN OCR在物流标签识别中的应用

在智能仓储管理中,OCR不仅是“看得懂文字”的工具,更是连接物理世界与数字系统的桥梁。本文介绍的基于CRNN 的轻量级OCR服务✨ 四大核心亮点总结1.高精度识别:尤其擅长中文与复杂背景下的文本提取;2.无需GPU:纯CPU运行,可在边缘设备、老旧服务器上部署;3.极速响应:平均识别时间小于1秒,满足实时作业需求;4.易集成:提供WebUI与REST API,无缝对接现有系统。虽然当前模型尚未支持

YOLOv8部署案例:智能仓储机器人导航系统

本文介绍了基于“星图GPU”平台自动化部署“鹰眼目标检测 - YOLOv8”镜像的实践案例,聚焦智能仓储机器人导航系统。该方案利用YOLOv8n轻量模型实现对人员、叉车、货架等关键目标的实时检测与统计,支持CPU环境下的高效推理,并通过WebUI提供可视化监控,适用于模型微调与AI应用开发等场景,显著提升机器人环境感知能力。

    共 343 条
  • 1
  • 2
  • 3
  • 35
  • 请选择