logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

创业团队如何利用Token Plan套餐优化AI应用开发成本

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

教育机构搭建AI编程辅导平台时如何选择与接入大模型服务

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

DeepSpeech库:适用于Linux ARM的Python语音识别工具

语音识别技术作为人工智能的一个分支,已经成为人机交互的重要组成部分。DeepSpeech是一个开源的语音识别系统,由Mozilla研究团队开发。它采用深度学习技术,将语音信号转换成可读文本,具有高效的性能和高准确率。DeepSpeech采用端到端的深度学习架构,能够从原始音频信号中直接学习到语音到文本的映射关系。这意味着用户无需进行复杂的语音特征提取或模型训练,简化了语音识别的过程。此外,它支持多

ollama部署本地大模型:embeddinggemma-300m在中小企业知识库检索中的落地

本文介绍了如何在星图GPU平台自动化部署【ollama】embeddinggemma-300m镜像,构建本地化企业知识库检索系统。该方案通过语义理解技术,将文档转换为向量实现智能检索,帮助中小企业快速查询产品资料、技术文档和客户服务信息,提升知识管理效率并保障数据安全。

从零部署SenseVoice-Small:ONNX量化语音识别模型Gradio前端完整教程

本文介绍了如何在星图GPU平台上自动化部署sensevoice-small-语音识别-onnx模型(带量化后),快速搭建一个支持多语言识别与情感分析的语音转文字应用。该平台简化了部署流程,用户可轻松创建智能字幕生成、会议纪要整理等实用工具,显著提升音频内容处理效率。

#语音识别
OpenClaw+ollama-QwQ-32B搭建个人知识库:从收集到生成

本文介绍了如何在星图GPU平台上自动化部署【ollama】QwQ-32B镜像,构建个人知识库系统。该方案结合OpenClaw自动化工具与QwQ-32B大语言模型,实现从网页内容抓取到智能摘要生成的全流程处理,特别适用于技术研究者高效管理海量文献资料。

Qwen3-ASR-1.7B实战:如何用Gradio搭建语音识别Web界面

本文介绍了如何在星图GPU平台上一键自动化部署Qwen3-ASR-1.7B语音识别模型v2镜像,并利用Gradio快速搭建语音识别Web界面。该方案支持多语言音频转文本,可广泛应用于会议记录、内容审核等场景,提升语音处理效率。

#语音识别
5步搞定SenseVoice语音识别模型部署与调用

本文介绍了如何在星图GPU平台上自动化部署sensevoice-small-语音识别-onnx模型(带量化后),实现高效的语音转文字功能。该镜像开箱即用,支持通过Web界面快速进行语音识别,典型应用于会议记录场景,能自动分段并高精度转写不同发言人的内容,大幅提升工作效率。

#语音识别
基于TensorRT的智能仓储机器人控制系统

在智能仓储场景中,基于TensorRT优化的视觉系统显著提升了机器人目标检测的实时性与能效。通过层融合、INT8量化和静态内存管理等技术,将YOLOv5推理延迟从120ms降至15ms以内,并支持多模型并发流水线处理。结合Jetson平台实现高效边缘推理,不仅提高响应速度,还延长了续航时间,推动机器人向高精度、低延迟的自主决策演进。

Lychee重排序模型在电商平台的落地实践

本文介绍了如何在星图GPU平台自动化部署Lychee多模态重排序模型,实现电商场景下的智能商品搜索优化。该模型能同时理解文本和图像信息,通过精准的重排序提升搜索结果相关性,显著改善用户搜索体验并提高转化率。

    共 369 条
  • 1
  • 2
  • 3
  • 37
  • 请选择