logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

千问3.5-27B效果实测:夜间拍摄图像关键物体识别准确率

本文介绍了如何在星图GPU平台上自动化部署千问3.5-27B镜像,实现高效的夜间图像关键物体识别。该多模态模型特别优化了低光照条件下的视觉理解能力,可准确识别城市街道、室内环境等场景中的主要物体,适用于安防监控、智能交通等夜间视觉分析场景。

构建AI Agent工作流时集成Taotoken作为统一模型层

将Taotoken配置为OpenClaw、Hermes Agent等AI Agent框架的模型提供方,本质上是通过一个统一的、标准化的接口来简化多模型的管理与调用。关键在于遵循框架的配置规范,准确无误地设置Taotoken的OpenAI兼容端点地址和模型ID。一旦完成集成,后续的模型实验、成本监控和团队协作都会变得更加清晰和高效。你可以访问Taotoken创建API Key并在模型广场查看所有可用

使用Taotoken为Claude Code配置稳定API连接解决封号困扰

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

为Claude Code配置Taotoken作为稳定大模型供应商的实践

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

vLLM-v0.11.0入门指南:从零开始部署多模态大模型推理服务

本文介绍了如何在星图GPU平台上自动化部署Vllm-v0.11.0镜像,快速搭建多模态大模型推理服务。该平台简化了部署流程,用户可轻松启动一个支持视觉语言模型(如Qwen3-VL)的API服务,实现图片理解与图文对话等典型应用,显著提升AI服务开发效率。

GTE中文向量模型应用场景解析:智能客服、舆情监控、知识图谱构建实战

本文介绍了如何在星图GPU平台上自动化部署GTE文本向量-中文-通用领域-large应用镜像,赋能智能客服场景——实现语义级意图识别与模糊问答匹配,显著提升用户问题响应准确率,替代传统关键词检索模式。

WebSocket实现实时语音对话流传输

本文介绍如何利用WebSocket、Opus编码和Web Audio API实现实时语音对话流传输,涵盖音频采集、编码压缩、低延迟传输及播放等关键技术环节,适用于在线教育、远程医疗等场景。

SenseVoice语音识别模型5分钟快速部署教程:支持50+语言一键识别

本文介绍了如何在星图GPU平台上自动化部署sensevoice-small-语音识别-onnx模型(带量化后)镜像,快速搭建多语言语音识别服务。该镜像集成了支持50+语言的SenseVoice模型,用户可通过简洁的Web界面轻松实现音频转写,典型应用于为会议录音或视频内容自动生成带情感分析的字幕。

#语音识别
Qwen3-ASR-1.7B软件测试实战:语音识别准确性评估方法

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-1.7B镜像,实现高效的语音识别准确性评估。该镜像支持52种语言和方言的自动语音转写,可广泛应用于会议转录、语音助手等场景,通过自动化测试脚本快速验证模型性能,提升语音应用的可靠性。

#语音识别
Fun-ASR多语言语音识别:5分钟快速部署,开箱即用

本文介绍了如何在星图GPU平台上自动化部署Fun-ASR-MLT-Nano-2512语音识别模型(二次开发构建by113小贝),实现多语言语音转文字功能。该镜像支持31种语言的实时转录,特别适用于国际会议记录、多媒体字幕生成等场景,5分钟即可完成部署并开箱即用。

#语音识别
    共 341 条
  • 1
  • 2
  • 3
  • 35
  • 请选择