logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

独立开发者如何利用Taotoken的Token Plan灵活控制AI应用成本

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

开发AI Agent时利用Taotoken实现多模型后备与路由

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

Hermes Agent 如何配置 custom 提供方以接入 Taotoken 的多模型服务

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。👉。

Qwen3-TTS-VoiceDesign实战教程:Python API调用qwen-tts 0.0.5生成带情感张力语音

本文介绍了如何在星图GPU平台上自动化部署Qwen3-TTS-12Hz-1.7B-VoiceDesign镜像,快速实现高表现力语音合成。通过Python API调用,用户可基于自然语言描述(如‘撒娇萝莉音’)生成带情感张力的语音,典型应用于短视频口播、儿童故事配音及多语言产品介绍等AI音频内容创作场景。

OpenClaw+千问3.5-27B智能客服:电商FAQ自动回复系统搭建

本文介绍了如何在星图GPU平台上自动化部署千问3.5-27B镜像,快速搭建电商FAQ自动回复系统。该方案利用千问3.5-27B强大的文档理解能力,可高效处理客户咨询,如产品参数查询、使用说明等常见问题,显著提升客服响应效率与准确率。

CosyVoice3开源声音克隆神器:支持普通话粤语英语日语18种方言,情感丰富语音合成

阿里开源的CosyVoice3实现仅用3秒音频复刻人声,支持自然语言控制情感与方言,精准标注多音字和音素发音,让语音合成更自然、个性化。无需复杂参数调整,普通用户也能轻松生成高质量语音。

零配置部署Fun-ASR,语音识别从此变得简单

本文介绍了基于星图GPU平台,可自动化部署Fun-ASR钉钉联合通义推出的语音识别大模型语音识别系统 构建by科哥镜像,实现零配置快速搭建。该镜像支持语音转写、实时识别与批量处理,典型应用于会议记录、课程录音转文字等场景,显著提升语音内容处理效率。

跨境电商平台开发实践:KoalaMart项目指南

随着全球经济一体化的不断深入和互联网技术的迅猛发展,跨境电商正在成为推动国际贸易增长的新引擎。它的出现,不仅为消费者提供了更多选择,也为商家打开了更广阔的市场。

Cosmos-Reason1-7B应用场景:智能仓储AGV路径规划前的视频预判分析

本文介绍了如何在星图GPU平台上自动化部署Cosmos-Reason1-7B多模态物理推理视觉语言模型(VLM),并探讨了其在智能仓储中的一个核心应用场景:通过分析AGV前置摄像头拍摄的视频,对前方通道的障碍物、人员活动等动态风险进行预判分析,从而为AGV的路径规划与安全行驶提供智能决策支持。

#计算机视觉
GPEN+电商平台整合:商品模特图质量提升实践

本文介绍了如何在星图GPU平台上自动化部署💆‍♀️GPEN - 智能面部增强系统镜像,高效提升电商商品模特图的人脸清晰度。该镜像专为人脸细节还原而优化,可一键修复手机实拍、老图库及AI生成图中模糊/失真的人脸区域,广泛应用于详情页首图优化与AI内容后处理,显著降低修图成本并提升用户停留时长。

    共 355 条
  • 1
  • 2
  • 3
  • 36
  • 请选择