被ldy取笑个人主页

@weixin_30951515

被ldy取笑

2023-03-01 18:36:59 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

独立开发者如何利用Taotoken低成本启动AI应用项目

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。👉。

AI Agent新范式：集成SenseVoice-Small语音识别能力的智能体开发

本文介绍了如何在星图GPU平台上自动化部署sensevoice-small-语音识别-onnx模型(带量化后)，为AI Agent赋予语音交互能力。该平台简化了部署流程，使开发者能快速构建具备“听觉”的智能体，典型应用场景包括驾驶时通过语音指令便捷、安全地调整车载导航目的地。

#语音识别

无需本地训练！通过VoxCPM-1.5-TTS-WEB-UI在线体验文本转语音黑科技

无需本地训练，通过VoxCPM-1.5-TTS-WEB-UI在浏览器中即可生成高保真、自然流畅的中文语音。支持少样本音色克隆与44.1kHz高采样率输出，结合Web界面让普通用户也能轻松实现专业级文本转语音，适用于教育、内容创作与智能客服等多个场景。

基于EmbeddingGemma-300m的智能客服意图识别系统

本文介绍了如何在星图GPU平台自动化部署【ollama】embeddinggemma-300m镜像，构建智能客服意图识别系统。该系统能精准理解用户查询的语义，自动分类咨询意图（如售前咨询、售后服务等），提升客服响应效率与用户体验。

#自然语言处理

支持SRT字幕生成的中文语音识别方案｜FunASR镜像开箱即用

本文介绍了如何在星图GPU平台上自动化部署FunASR语音识别镜像（基于speech_ngram_lm_zh-cn二次开发构建by科哥），快速实现中文语音转文字及SRT字幕生成功能，适用于视频剪辑、会议记录、在线课程字幕制作等典型场景，开箱即用，无需编程。

#语音识别

FunASR语音识别效果展示：实测会议录音转文字，生成带时间戳字幕

本文介绍了如何在星图GPU平台上自动化部署FunASR语音识别镜像（基于speech_ngram_lm_zh-cn二次开发构建by科哥），实现高效会议录音转文字功能。该镜像特别优化了中文长句识别和标点恢复能力，可自动生成带时间戳的字幕文件，显著提升会议记录效率，适用于视频会议回放、纪要整理等场景。

#语音识别

Youtu-VL-4B-Instruct实战案例：用Youtu-VL-4B-Instruct自动审核电商平台主图合规性

本文介绍了如何在星图GPU平台上自动化部署腾讯优图的Youtu-VL-4B-Instruct多模态视觉语言模型，并构建一个智能电商主图合规性审核系统。该系统能自动识别图片中的违规文字、违禁品及质量问题，显著提升电商平台的内容审核效率与准确性。

GLM-Image实战：电商主图自动生成全流程解析

本文介绍了如何在星图GPU平台上自动化部署智谱AI GLM-Image 文本生成图像模型的 Web 交互界面镜像，快速构建电商主图生成环境。用户无需配置依赖或命令行操作，即可通过自然语言提示词一键生成符合平台规范的高质量商品主图，显著提升新品上架效率。

DeepSeek-OCR开源镜像实操：无需代码，Web界面完成专业级OCR

本文介绍了如何在星图GPU平台上自动化部署🏮 DeepSeek-OCR · 万象识界镜像，实现专业级光学字符识别。用户无需编写代码，通过简洁的Web界面即可上传图片，将复杂的文档（如合同、论文截图）智能转换为结构清晰的Markdown格式，极大提升了文档数字化与内容提取的效率。

#DeepSeek

macOS下OpenClaw深度配置：Qwen3.5-4B-Claude多模型切换实战

本文介绍了如何在星图GPU平台上自动化部署Qwen3.5-4B-Claude-4.6-Opus-Reasoning-Distilled-GGUF镜像，实现多模型智能切换功能。该方案特别适用于技术文档处理场景，能根据任务类型自动选择最优模型，如使用Qwen生成代码、Claude优化文档结构，显著提升AI辅助工作效率。

共 337 条

请选择