logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

零镜头学习:AI Challenger 2018 项目实战

零镜头学习(Zero-Shot Learning, ZSL)是一种先进的机器学习方法,它的出现源于对传统机器学习技术局限性的反思。在传统方法中,模型需要大量的标记样本才能进行有效的训练,而在现实世界中获取这些标记数据往往代价高昂且不切实际。零镜头学习的提出,就是要解决在没有或很少有标记数据的情况下,如何让机器学习模型识别和理解新的类别。这种学习方式对于扩展机器学习应用的范围具有深远的意义,尤其是在

Flipperbot GT:翻转机器人设计与实施

简介:翻转机器人(Flipperbot)是一种革命性的机器人设计,由螃蟹实验室开发,它结合了机器人学、机械工程和人工智能,提升了机器人在执行特定任务时的机动性和适应性。Flipperbot GT作为项目的核心,利用高级算法实现稳定运动控制,并能够在复杂的地形中进行操作。此项目不仅对硬件设计进行了详尽的测试,还包含软件开发,如实时操作系统、运动规划算法和用户界面。此外,它还具有开源特性,允许公众参与

Python爬虫数据增强:用DeOldify自动上色爬取的历史图片

本文介绍了如何利用星图GPU平台自动化部署DeOldify图像上色镜像,构建一条高效的数据增强流水线。该方案结合Python爬虫批量获取历史黑白图片,并通过DeOldify基于U-Net深度学习模型实现自动化上色,典型应用于为历史研究、文化保护项目快速生成高质量的彩色影像数据集。

#深度学习
Qwen3-32B助力跨境电商:多语言商品描述生成

Qwen3-32B凭借320亿参数和128K上下文,支持高质量多语言商品描述生成,具备深度语境理解与跨语言风格迁移能力。通过思维链推理与精细化提示工程,实现高效、合规、品牌一致的全球化内容输出,显著提升跨境电商上架速度并降低成本。

CogVideoX-2b实战案例:电商产品描述→15秒营销短视频生成

本文介绍了如何在星图GPU平台上自动化部署CogVideoX-2b (CSDN专用版)镜像,实现AI驱动的视频内容创作。该平台简化了部署流程,用户可快速利用该工具,将电商产品描述等文本内容高效转化为15秒营销短视频,显著提升内容生产效率。

MGeo地址解析模型部署教程:模型可解释性(LIME/SHAP)可视化分析

本文介绍了如何在星图GPU平台上自动化部署MGeo门址地址结构化要素解析-中文-地址领域-base镜像,并集成LIME与SHAP工具进行模型可解释性分析。通过该平台,用户可以快速搭建地址解析服务,并利用可视化工具深入理解模型如何从文本中识别省、市、道路等关键要素,从而提升模型透明度与调试效率。

Stable-Diffusion-v1-5-archiveWebUI定制化:CSDN平台界面主题与快捷按钮扩展

本文介绍了如何在星图GPU平台上自动化部署stable-diffusion-v1-5-archive镜像,并对其WebUI进行深度定制化。通过自定义界面主题和添加快捷按钮,用户可以显著提升AI图片生成的效率与操作体验,例如快速应用预设风格生成特定类型的图像。

SenseVoice Small音频预处理揭秘:VAD语音活动检测合并技术解析

本文介绍了如何在星图GPU平台上自动化部署SenseVoice Small镜像,实现高精度、低延迟的多语种语音识别。该镜像内置增强型VAD语音活动检测与智能合并模块,特别适用于会议录音转写、短视频口播识别等含背景音与不规则停顿的真实语音处理场景。

#语音识别
SenseVoice-small-onnx语音识别实战:Python批量处理1000+音频文件

本文介绍了如何在星图GPU平台上自动化部署sensevoice-small-语音识别-onnx模型(带量化后),并利用Python脚本实现批量语音转文字。该方案能高效处理海量音频文件,典型应用于自动化会议纪要整理、播客内容转录等场景,显著提升工作效率。

#语音识别
一键部署Qwen3-ASR-1.7B:打造私有化语音识别平台

本文介绍了如何在星图GPU平台上一键自动化部署Qwen3-ASR-1.7B语音识别模型v2,快速构建私有化语音识别服务。该模型支持多语言识别,可应用于会议记录转写、客服质检等企业场景,提供高精度且完全离线的语音转文本解决方案。

#语音识别
    共 346 条
  • 1
  • 2
  • 3
  • 35
  • 请选择