logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

将 Hermes Agent 工具链接入 Taotoken 实现自定义模型调用

Hermes Agent 是一个流行的开源智能体框架,它支持通过配置不同的模型提供者(Provider)来调用多种大语言模型。如果你正在使用 Hermes Agent,并且希望通过 Taotoken 平台来管理和调用模型,本文将为你提供一个清晰的对接指南。整个过程主要涉及将提供者类型设置为custom,并正确配置 Taotoken 的 API 端点与密钥。

初创公司如何利用多模型聚合能力低成本构建AI产品原型

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

ESP32语音识别语音压缩存储

本文深入解析ESP32如何通过I²S接口采集音频,利用TFLite Micro实现本地关键词识别,并采用ADPCM等算法高效压缩语音数据,结合PSRAM与存储管理策略,构建低功耗、离线可用的语音处理系统,适用于智能家居、安防等多种场景。

#语音识别
Qwen3-TTS声音克隆效果展示:中文普通话+粤语+闽南语三语同源克隆

本文介绍了如何在星图GPU平台上自动化部署【声音克隆】Qwen3-TTS-12Hz-1.7B-Base镜像,实现基于单段录音的普通话、粤语、闽南语三语同源语音克隆。该方案适用于多语种在线教育、跨境电商本地化解说及方言保护等典型场景,显著提升语音内容生产效率与真实感。

ollama部署QwQ-32B详细步骤:含310亿非嵌入参数加载优化

本文介绍了如何在星图GPU平台上自动化部署【ollama】QwQ-32B镜像,充分发挥其310亿非嵌入参数与131K超长上下文优势,典型应用于技术文档深度分析与多步逻辑推理任务,如自动解析PDF白皮书、拆解复杂开发需求并生成可执行任务清单。

使用Dify平台快速部署SenseVoice-Small语音识别服务

本文介绍了如何在星图GPU平台自动化部署sensevoice-small-语音识别-onnx模型(带量化后),实现高效的语音转文本服务。该方案支持快速构建语音识别API,适用于会议转录、实时字幕生成等场景,显著提升语音处理应用的开发效率。

#语音识别
百度SDK集成实现Android语音识别应用

在当今的智能应用中,语音交互已成为用户界面的重要组成部分。百度语音识别SDK提供了一个强大的工具集,旨在简化开发者对语音交互功能的集成与实现。本章将详细探讨SDK的核心功能,为后续的集成和优化步骤打下坚实的基础。在人机交互领域,唤醒词技术作为一种能够有效触发设备响应的关键技术,已经被广泛应用于智能助理、智能家居控制和车载语音系统中。唤醒词,也被称作“热词”,一般被设计为易于识别的特定短语,当用户说

CLIP-GmP-ViT-L-14企业应用:电商平台主图-标题-详情页三元组一致性校验

本文介绍了如何在星图GPU平台上自动化部署CLIP-GmP-ViT-L-14镜像,并将其应用于电商平台的内容质量管控。该方案的核心是利用该多模态模型,自动校验商品主图、标题与详情页描述之间的一致性,从而高效识别图文不符的商品,提升平台内容质量与用户体验。

Qwen3.5-4B-Claude-Opus-GGUF开发者案例:前端工程师的JS逻辑调试与重构建议生成

本文介绍了如何在星图GPU平台上自动化部署Qwen3.5-4B-Claude-4.6-Opus-Reasoning-Distilled-GGUF镜像,该镜像专为前端开发优化,能高效分析JavaScript代码逻辑并提供重构建议。通过实际案例展示了其在调试复杂条件判断、优化异步流程等场景中的应用,帮助开发者提升代码质量与维护效率。

千问3.5-2B效果展示:同一张发票图,分别执行‘读文字’‘辨金额’‘判类型’三重任务

本文介绍了如何在星图GPU平台上自动化部署千问3.5-2B镜像,实现高效的发票信息处理。该视觉语言模型能够同时执行文字识别、金额辨别和类型判断三重任务,特别适用于财务票据的自动化处理场景,显著提升数据提取与分类的效率。

    共 336 条
  • 1
  • 2
  • 3
  • 34
  • 请选择