logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Godot4自定义状态机实战:看守地宫怪物完整源代码

Godot是一个开源、跨平台的游戏开发引擎,它为游戏开发者提供了一个完整的生态系统,包括视觉编辑器、脚本编写、调试工具等。其最吸引人的特性是易于学习,拥有直观的界面和强大的功能,可以用来开发从简单2D游戏到复杂3D游戏的所有类型项目。状态机(State Machine),又称作有限状态自动机(Finite State Machine, FSM),是一种数学计算模型,用于设计具有不同状态的对象,其中

DAMO-YOLO手机检测镜像安全加固指南:端口限制、访问控制与日志审计

本文介绍了如何在星图GPU平台上自动化部署实时手机检测-通用基于 DAMO-YOLO 和 TinyNAS WebUI 镜像,实现高效的手机目标检测功能。该镜像可广泛应用于智能安防监控场景,通过深度学习技术快速识别图像或视频流中的手机设备,为公共场所的电子设备使用管理提供技术支撑。

#目标检测
OneAPI实操手册:基于Docker的一键部署,实现腾讯混元、字节豆包、讯飞星火API标准化调用

本文介绍了如何在星图GPU平台上自动化部署OneAPI镜像,该镜像通过标准的 OpenAI API 格式统一接入腾讯混元、字节豆包、讯飞星火等大模型,开箱即用。用户可快速构建标准化AI服务网关,典型应用于多模型协同的智能客服、内容生成与A/B测试等场景,显著提升开发与运维效率。

HY-Motion 1.0高算力适配能力:26GB显存下1.0B模型推理延迟<800ms实测

本文介绍了如何在星图GPU平台上自动化部署HY-Motion 1.0镜像,实现高效的文本驱动3D动作生成。该平台简化了部署流程,用户可快速利用该十亿参数模型,在26GB显存环境下以低于800ms的延迟,将文本描述转化为流畅的3D人体动画,为游戏开发、虚拟人交互等场景提供强大的内容创作工具。

Qwen3-ASR-1.7B效果展示:电话客服录音(低码率AMR)识别质量实测

本文介绍了如何在星图GPU平台自动化部署Qwen3-ASR-1.7B镜像,实现高质量语音识别功能。该模型特别适用于电话客服录音转写场景,能有效处理低码率AMR音频,准确识别多方言和专业术语,提升客服效率与服务质量。

#语音识别
Qwen3-ASR-0.6B效果展示:中英混杂技术汇报语音→结构化文字+关键术语提取

本文介绍了如何在星图GPU平台上自动化部署Qwen3-ASR-0.6B镜像,实现高效语音转文字功能。该模型专为中英文混杂、术语密集的复杂场景优化,能精准识别技术汇报、学术讲座等语音内容,并输出结构清晰的文本,为后续信息提炼和知识管理奠定基础。

#语音识别
DAMOYOLO-S精彩案例:单图秒出80类标签+坐标框,精度与速度兼得

本文介绍了如何在星图GPU平台上自动化部署DAMOYOLO-高性能通用检测模型-S镜像,快速构建通用目标检测服务。该服务能对上传的图片进行实时分析,在复杂街景等场景中,秒级识别并定位人、车、交通标志等80类常见物体,输出带坐标框和标签的可视化结果,实现精度与速度的平衡。

#目标检测#计算机视觉
CogVideoX-2b多场景落地:短视频运营、AIGC内容工厂、数字人视频素材生成

本文介绍了如何在星图GPU平台上自动化部署🎬 CogVideoX-2b (CSDN 专用版)镜像,实现AI视频生成。该平台简化了部署流程,用户可通过输入文字描述,快速生成高质量短视频素材,典型应用于短视频运营中的创意内容批量生产,有效提升创作效率。

#AIGC
RaNER与StanfordNLP对比:中文NER准确率实测部署教程

对于特定领域术语(如医学名词、产品型号),可通过添加外部词典提升召回率。# 示例:扩展ORG类实体'ORG': ['通义实验室', '达摩院', 'CSDN']'end': end})⚠️ 注意:应在模型输出基础上做后处理融合,避免覆盖原有预测。RaNER在中文NER任务中全面领先:无论是准确率(+10.7% F1)、推理速度(快4倍)还是资源利用率,都显著优于StanfordNLP;WebUI极

告别手动标注!PP-DocLayoutV3保姆级教程:上传图片自动分析版面

本文介绍了如何在星图GPU平台上自动化部署PP-DocLayoutV3文档版面分析模型v1.0,实现文档图片的智能版面分析。用户只需上传图片,该模型即可自动识别并标注其中的标题、正文、表格、图片等元素,为后续的OCR识别、信息提取等文档数字化处理提供精准的结构化数据,大幅提升工作效率。

    共 326 条
  • 1
  • 2
  • 3
  • 33
  • 请选择