咸鱼豆腐个人主页

@weixin_34885746

咸鱼豆腐

2022-12-23 16:26:05 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

MATLAB实现的高效语音识别算法源代码

语音识别技术已经渗透到日常生活的各个层面，从智能助手到客户服务机器人，其背后的算法正变得越来越智能。本章将重点介绍语音识别算法的基本概念、发展历程以及它在不同领域的实际应用。在GMM-HMM模型中，状态转移概率和观察概率是两个核心的参数，它们共同定义了模型的动态行为。如keraspytorch和tensorflow等深度学习框架，它们提供了更加灵活和强大的模型构建能力。高级API不仅包括了数据预处

多语言语音识别神器：Qwen3-ASR-1.7B部署与使用指南

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-1.7B镜像，实现高精度多语言语音识别。该镜像支持52种语言及22种中文方言，适用于会议录音转文字、客服语音质检、短视频字幕生成等典型场景，全程离线运行，开箱即用。

#语音识别

LLaVA-v1.6-7b智能客服案例：图片问答系统搭建

本文介绍了如何在星图GPU平台自动化部署llava-v1.6-7b镜像，快速搭建智能图片问答系统。该多模态模型能理解图片内容并进行自然对话，典型应用于电商客服场景，用户上传商品图片即可自动识别并回答产品相关问题，显著提升客服效率与用户体验。

手把手教程：ollama一键部署128K超长上下文代码模型

本文介绍了如何在星图GPU平台上自动化部署【ollama】Yi-Coder-1.5B镜像，快速启用128K超长上下文代码理解与生成能力。用户无需配置环境，即可实现代码审查、跨文件分析及多语言（Python/Java/SQL等）智能补全，典型应用于遗留系统文档补全与复杂项目结构解读。

#编程助手

实时语音转写不再是梦：Fun-ASR流式识别模拟方案

通过VAD检测与分段识别技术，Fun-ASR在非流式模型基础上实现类实时语音转写体验。系统自动切分语音片段、跳过静音区间，结合前端累积展示，显著降低感知延迟，兼容现有模型且无需架构改动，为会议、教学等场景提供高效解决方案。

京东智能客服升级方案：引入HeyGem数字人提升用户体验

京东引入HeyGem数字人系统，将智能客服从文字语音升级为可看可听的面对面交互。通过AI驱动唇形同步与自然表情，结合私有化部署保障安全，实现低成本、高效率的视频内容批量生成，已在售后、导购等场景落地应用。

ollama部署LFM2.5-1.2B-Thinking：边缘AI写作新选择

本文介绍了如何在星图GPU平台自动化部署【ollama】LFM2.5-1.2B-Thinking镜像，实现高效的边缘AI写作。该轻量级模型支持离线环境下的多场景文本生成，如技术博客创作、营销文案撰写和学术写作辅助，为用户提供安全、便捷的本地化AI写作解决方案。

#边缘计算

家庭实验室：树莓派部署OpenClaw+ollama-QwQ-32B轻量版

本文介绍了如何在星图GPU平台上自动化部署【ollama】QwQ-32B轻量版镜像，实现高效的家庭自动化助手功能。通过该平台，用户可快速搭建本地化AI环境，应用于定时信息收集、文件自动化处理等场景，显著提升日常任务效率。

Whisper-large-v3开源语音识别指南：从零配置到实时麦克风转录

本文介绍了如何在星图GPU平台上自动化部署Whisper语音识别-多语言-large-v3语音识别模型二次开发构建by113小贝镜像，实现本地化、低延迟的实时语音转文字功能。典型应用场景包括会议录音自动整理、多语种技术视频字幕生成及播客内容快速纪要，全程离线运行，无需依赖网络API。

#语音识别

Vue自定义精美商品分类组件，助力电商开发

通过组件化开发提升效率，降低维护成本，本文介绍一款适用于电商分类页面的Vue自定义精美商品分类组件，支持灵活配置与点击交互，显著优化前端开发体验。

共 361 条

请选择