logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI万能分类器部署案例:企业知识库自动归类系统

本文介绍了一套基于StructBERT 零样本分类模型真正的零训练成本:只需定义标签即可使用,极大降低AI应用门槛。强大的中文语义理解能力:依托达摩院先进模型,在复杂业务场景下仍保持高精度。完整的可视化交互体验:WebUI 让非技术人员也能轻松操作,加速落地进程。高度可扩展性:适用于工单分类、舆情监控、智能问答等多个高价值场景。随着大模型技术的发展,零样本学习正在成为企业智能化建设的新基建。它不再

无需深度学习基础:CRNN OCR快速上手

CRNN 全称为卷积循环神经网络(Convolutional Recurrent Neural Network),它并非简单的 CNN + RNN 堆叠,而是针对图像序列识别任务精心设计的端到端模型。其核心思想是:将输入图像视为一个“视觉序列”,逐列提取特征后,交由循环网络建模上下文关系,最终输出字符序列。这与人类阅读方式高度相似——我们不是一次性识别整行字,而是从左到右逐字扫视,并结合前后文判断

Home Assistant联动语音设置智能家居

本文介绍如何将Home Assistant与Google Assistant、Amazon Alexa和Apple Siri三大语音助手联动,实现本地化、低延迟、高安全的智能家居语音控制,涵盖配置步骤、常见问题与高阶自动化技巧。

OpenClaw极简配置法:千问3.5-35B-A3B-FP8快速接入指南

本文介绍了如何在星图GPU平台上自动化部署千问3.5-35B-A3B-FP8镜像,实现高效的大语言模型应用。通过极简配置法,用户可快速接入该镜像并验证基础功能,如文件操作和网页搜索,适用于本地或云端模型的快速测试与集成。

IDEA集成开发环境下的AI编程:通义千问1.5-1.8B模型插件开发初探

本文介绍了如何在星图GPU平台上自动化部署通义千问1.5-1.8B-Chat-GPTQ-Int4 WebUI镜像,以构建本地AI编程助手。该镜像可集成至IDEA等开发环境,实现代码智能解释、单元测试生成等核心功能,有效提升开发效率与代码理解速度。

通义千问2.5-7B多模态扩展:结合视觉模型实战案例

本文介绍了如何在星图GPU平台自动化部署通义千问2.5-7B-Instruct镜像,实现多模态AI应用。通过结合视觉模型,该方案能让语言模型具备图像理解能力,典型应用于电商场景的商品图片分析,自动生成产品描述和使用建议,提升内容处理效率。

Kotaemon在电商客服中的落地实践分享

通过Kotaemon框架,电商客服实现了从问答机器人到任务执行者的跨越,支持工具调用、多轮对话管理与安全可控的生产级智能体落地,显著提升响应速度与用户满意度,推动服务模式的根本转变。

Whisper-large-v3实战:如何用GPU加速实现高精度语音转文字

本文介绍了如何在星图GPU平台上自动化部署Whisper语音识别-多语言-large-v3语音识别模型 二次开发构建by113小贝镜像,实现高精度语音转文字。该平台支持GPU加速,可快速处理多语言音频转录任务,典型应用于视频字幕自动生成、会议录音转写等场景,显著提升语音识别效率与准确性。

#语音识别
WebAPI扩展实践:SenseVoice-Small ONNX后端服务接口开发教程

本文介绍了如何在星图GPU平台上自动化部署⚡ SenseVoice-Small ONNX语音识别工具,并构建高性能WebAPI服务。该平台简化了部署流程,使开发者能快速搭建语音转文字服务,典型应用场景包括为在线会议、内容创作平台等自动生成字幕或会议纪要,提升工作效率。

#语音识别
多格式支持:寻音捉影·侠客行兼容性测试报告

本文介绍了如何在星图GPU平台上自动化部署🗡️ 寻音捉影·侠客行 (Shadow & Sound Hunter)镜像,实现本地化音频关键词检索。该工具基于FunASR算法,支持MP3、WAV、FLAC等多种音频格式,可高效应用于会议录音整理、自媒体素材检索等场景,在保障隐私安全的同时提升音频内容处理效率。

#语音识别
    共 288 条
  • 1
  • 2
  • 3
  • 29
  • 请选择