logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

千问3.5-2B快速上手:上传→提问→点击识别,三步获取中文图文理解结果

本文介绍了如何在星图GPU平台上自动化部署千问3.5-2B镜像,实现中文图文理解功能。该模型能够快速分析上传的图片并生成文字描述,适用于电商商品描述、文档文字提取等场景,大幅提升内容处理效率。

chatgpt plus

ChatGPT Plus 是什么?抱歉,我不知道 ChatGPT Plus 是什么。OpenAI 发布的最新语言模型是 GPT-3,但是我不知道 ChatGPT Plus 是否是 OpenAI 的一个产品。请提供更多关于 ChatGPT Plus 的信息,我会尽力回答你的问题。...

#人工智能
Qwen-Image在跨境电商多语言广告图生成中的适应性

Qwen-Image基于MMDiT架构,实现高精度多语言广告图生成与像素级编辑,支持中英文混排、局部修改和批量本地化,大幅提升跨境电商视觉内容生产效率与品牌一致性。

语音反馈增强体验:Fun-ASR+TTS组合应用示例

本文介绍了如何在星图GPU平台上自动化部署Fun-ASR钉钉联合通义推出的语音识别大模型语音识别系统 构建by科哥镜像,快速构建具备语音反馈能力的ASR+TTS交互系统,典型应用于会议实时转录、工厂巡检语音确认及无障碍语音助手等需要即时响应的场景。

#语音识别
FLUX.1-dev移动端集成:API封装与轻量部署教程

本文介绍了如何在星图GPU平台上自动化部署FLUX.1-dev镜像,并构建一个面向移动端的AI绘图API服务。通过将模型封装为轻量化的FastAPI接口,开发者可以轻松实现移动应用调用,典型应用场景是让用户通过输入文字描述,在App内快速生成高质量、照片级的AI图片。

Gemma-3-12B-IT入门必看:模型路径/root/ai-models/LLM-Research验证指南

本文介绍了如何在星图GPU平台上自动化部署gemma-3-12b-it高性能开源大语言模型(LLM)WebUI镜像,并快速验证其部署状态。该镜像提供了一个便捷的Web交互界面,用户可通过其进行智能对话、代码生成与文本创作等任务,是快速体验与评估大语言模型能力的理想工具。

Qwen3-ASR-1.7B在车载系统中的应用:智能语音助手开发

本文介绍了如何在星图GPU平台自动化部署Qwen3-ASR-1.7B语音识别模型v2,实现车载智能语音助手的开发。该模型具备强噪声稳定性和多方言支持,典型应用于车载环境中的语音控制,如调节空调、导航和娱乐系统,提升驾驶安全与交互体验。

#语音识别#车载系统
Qwen3-ASR-0.6B效果展示:陕西话秦腔选段→入声字与喉塞音特征建模

本文介绍了如何在星图GPU平台自动化部署Qwen3-ASR-0.6B镜像,实现对方言语音的高精度识别。该镜像特别适用于陕西方言秦腔的自动转写,能精准建模入声字和喉塞音特征,为文化传承和语音研究提供高效AI支持。

#语音识别
法律行业应用:Whisper-large-v3庭审录音自动转录系统

本文介绍了如何在星图GPU平台自动化部署Whisper语音识别-多语言-large-v3语音识别模型(二次开发构建by113小贝),实现庭审录音的自动转录。该方案能高效处理法律场景中的多语言和方言音频,准确转写为文本,大幅提升法律文书 preparation 的效率。

#语音识别
卡证检测矫正模型惊艳效果:护照金属光泽干扰下四角点鲁棒定位

本文介绍了如何在星图GPU平台上自动化部署卡证检测矫正模型,该模型能精准定位护照等证件在金属光泽干扰下的四角点并进行透视矫正。通过该平台,用户可快速搭建处理环境,轻松实现证件图片的自动摆正与标准化,直接应用于金融、政务等场景的自动化信息录入流程。

    共 374 条
  • 1
  • 2
  • 3
  • 38
  • 请选择