logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

MATLAB实现CNN的手写数字识别项目教程

手写数字识别是一项经典的机器学习任务,它不仅有着悠久的历史,也是现代深度学习技术发展的催化剂之一。这项技术在现实世界中的应用场景极为广泛,如邮政编码识别、银行支票的数字自动识别、各种电子设备的密码输入等。随着技术的进步,手写数字识别的准确率越来越高,对于推动智能设备的发展和改善用户体验起到了积极的作用。MATLAB,全称为Matrix Laboratory,是一种用于算法开发、数据可视化、数据分析

Claude Code 安装后如何配置 Taotoken 密钥与聚合端点

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

VB语音识别程序入门:Hello World项目

本文还有配套的精品资源,点击获取简介:在Visual Basic中使用Microsoft Speech SDK开发语音识别程序,本课程介绍初学者如何快速理解和实践VB中的语音识别。通过创建SpeechRecognitionEngine对象、定义识别语法、处理语音识别事件、启动和停止识别,以及处理识别结果等关键步骤,构建一个基础的语音交互程序。提供示例代码和步骤,帮助开发者...

ollama-QwQ-32B模型量化:OpenClaw在低配电脑的部署方案

本文介绍了如何在星图GPU平台上自动化部署【ollama】QwQ-32B量化模型,实现低配置设备的高效AI应用。通过模型量化技术,该方案将内存占用降低50%,使其能在4GB内存设备上稳定运行,适用于文件自动整理、文本处理等轻量级自动化任务,显著提升老旧设备的AI处理能力。

GLM-TTS能否用于盲人导航设备?户外实时语音指引系统

GLM-TTS通过零样本语音克隆、情感控制和流式推理,实现个性化、实时的户外导航语音指引。支持亲属声音复现、多级情绪提示与地名精准发音,可在边缘设备上离线运行,提升视障用户的安全感与信任感,推动无障碍交互技术落地。

GRPO强化学习新范式:多模态大模型行为对齐的未来方向

GRPO通过引入结构化、向量化的奖励信号,突破传统强化学习在多模态场景下的局限,实现更精细的行为对齐。结合ms-swift框架的一体化训练与部署能力,该方案显著降低工程复杂度,推动大模型从标量反馈迈向多维优化,为视觉、语言等跨模态任务提供高效可控的对齐路径。

SenseVoice-Small ONNX模型本地化部署:离线环境无网络语音识别完整方案

本文介绍了如何在星图GPU平台自动化部署sensevoice-small-语音识别-onnx模型(带量化后),实现完全离线的多语言语音识别。该方案特别适用于隐私敏感的医疗记录转写场景,无需网络连接即可快速准确地将语音转换为文本,并支持情感分析和音频事件检测。

#语音识别
小白必看:Qwen3-ASR-1.7B语音识别工具快速上手

本文介绍了如何在星图GPU平台上自动化部署🎙️ Qwen3-ASR-1.7B高精度语音识别工具。该工具支持本地离线运行,能高效、精准地将会议录音、课程音频等文件转换为文字,特别适用于视频字幕制作、会议纪要整理等场景,兼顾了效率与隐私安全。

#语音识别
SenseVoice-Small语音识别模型在STM32嵌入式系统中的应用探索

本文介绍了如何在星图GPU平台上自动化部署sensevoice-small-语音识别-onnx模型(带量化后),实现轻量级语音识别。该平台简化了部署流程,使开发者能快速构建应用。该模型特别适用于嵌入式场景,如智能家居设备中的离线关键词唤醒与简单指令识别,兼顾了实时性与隐私安全。

#语音识别
本地化部署FunASR语音识别服务|基于科哥二次开发镜像

本文介绍了基于“星图GPU”平台自动化部署FunASR语音识别基于speech_ngram_lm_zh-cn二次开发构建by科哥镜像的方法,实现本地化语音转文字服务。该方案支持WebUI操作与API调用,适用于会议记录、教学录音转写等场景,兼顾数据安全与高精度识别,助力AI应用快速开发落地。

    共 381 条
  • 1
  • 2
  • 3
  • 39
  • 请选择