国营窝窝乡蛮大人个人主页

@weixin_36019375

国营窝窝乡蛮大人

2022-07-08 17:27:52 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

C++_OpenCV相机标定实战：从基础到应用

相机标定是计算机视觉领域中的一项基础技术，用于确定相机的内在参数（内参）以及可能的外部参数（外参）。内参包括焦距、主点坐标和畸变系数等，是相机内部光学系统特性的数学表示。外参则描述了相机相对于世界坐标系的位置和姿态。标定过程涉及到拍摄一系列已知几何特性的标定物，通过分析这些图像来计算这些参数。OpenCV（Open Source Computer Vision Library）是一个开源的计算机视

千问3.5-27B实战落地：教育机构用图片理解接口自动批改学生手写作答扫描件

本文介绍了如何在星图GPU平台上自动化部署千问3.5-27B镜像，并利用其图片理解能力构建教育应用。该系统能自动批改学生手写作答扫描件，将老师从繁重的重复劳动中解放出来，实现了批改效率的显著提升与标准的统一。

为 Hermes Agent 配置 Taotoken 作为自定义模型提供商

对于使用 Hermes Agent 框架的开发者而言，直接接入多个大模型厂商的 API 往往意味着需要管理不同的密钥、端点和计费方式。Taotoken 平台通过提供统一的 OpenAI 兼容 API，简化了这一过程。本文将详细介绍如何将 Taotoken 配置为 Hermes Agent 的自定义模型提供商，让你能够通过一个统一的接口调用平台上的多种模型。

利用Taotoken实现AI应用的高可用与容灾路由设计思路

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。👉。

为我的 AI Agent 项目选择 Taotoken 作为多模型供应商的接入实践

通过引入 Taotoken，我们的 AI Agent 项目在模型层实现了显著的简化。开发团队不再需要维护多套供应商 SDK 和密钥，运维团队也能从一个控制台总览所有模型的调用情况与费用支出。模型切换和 A/B 测试变成了一个修改配置参数的动作，迭代效率得到了提升。当然，在实际使用中，我们遵循平台的最佳实践，例如合理设置请求超时、实现客户端重试机制以应对网络波动，并密切关注控制台的用量提示。平台的路

iOS语音识别项目实战：Google API集成

在信息时代，语音识别技术正在变得日益重要，而Google的语音识别API为开发者提供了一种强大的工具，它能够将语音转化为文本，从而让机器能够理解人类的语言。Google语音识别API是一个集成了Google强大机器学习能力的服务，它可以轻松地被集成到各种应用中，从而为用户提供方便的语音交互功能。Google语音识别API支持将用户的语音转化为文本信息，具有高准确度和广泛的语言支持。基本功能覆盖实时

RVC声音克隆零基础教程：3分钟极速训练，小白也能玩转AI翻唱

本文介绍了如何在星图GPU平台上自动化部署RVC镜像，实现AI声音克隆与翻唱功能。通过该平台，用户可快速搭建语音转换环境，仅需3-5分钟音频样本即可训练个性化声学模型，应用于虚拟主播、音乐制作等场景，大幅降低AI语音技术的使用门槛。

Qwen3-ASR-0.6B部署全攻略：支持52种语言的语音识别

本文介绍了如何在星图GPU平台自动化部署Qwen3-ASR-0.6B镜像，实现支持52种语言的语音识别功能。该镜像可快速搭建语音转文字服务，典型应用于视频字幕自动生成、会议记录整理等场景，显著提升多语言音频处理效率。

#语音识别

Qwen3-ASR语音识别：22种中文方言识别实测

本文介绍了如何在星图GPU平台自动化部署Qwen3-ASR语音识别镜像，实现高效的中文方言识别。该镜像支持22种方言的精准转写，可应用于方言保护、语音转文字和文化传承等场景，大幅提升多方言语音处理能力。

#语音识别

一键部署：Qwen3-ASR-1.7B语音识别服务搭建

本文介绍了如何在星图GPU平台上一键自动化部署Qwen3-ASR-1.7B大模型驱动的语音识别镜像，快速搭建多语言语音识别服务。该服务可广泛应用于视频字幕自动生成、会议记录转录等场景，显著提升语音处理效率与自动化水平。

#语音识别

共 388 条

请选择