logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【ROS】【TTS】在ROS中使用离线的语音合成算法,科大讯飞语音合成算法平替

创建本仓库的初衷是为了想在ROS中使用语音合成,播报目标检测的检测结果或者进行语音交互使用。但是在网上搜索一圈发现,基本上没有免费离线的TTS并且还需要注册和联网(说的就是你,科大讯飞)。本着能白嫖就白嫖的原则,便在github搜索一番,发现一个很棒的离线的TTS仓库SummerTTS,还是用C++写的,看到这个仓库之后,真的是两眼放光,立马克隆下来研究一番。十分建议在使用本仓库之前,仔细观看原仓

文章图片
#算法
Visual Studio中部署PaddleOCRv5 (借助ncnn框架)

本文介绍了基于ncnn框架在Visual Studio中部署PaddleOCRv5文字识别算法的实现过程。项目通过移植nihui的Android端OCR检测代码到Windows平台,使用opencv-mobile库支持多语言显示。详细说明了环境配置(VS2019、ncnn、opencv-mobile)、工程设置、依赖项添加等步骤,并提供了图像和文件夹批量识别的命令行接口。测试结果显示算法能有效识别

文章图片
#visual studio#ide
【YOLO11】【DeepSort】【NCNN】使用YOLOv11和DeepSort进行行人目标跟踪。(基于ncnn框架,c++实现)

本文介绍了基于YOLOv11和DeepSort算法的行人目标跟踪系统,使用NCNN框架在C++环境下实现。项目通过YOLOv11 nano版本进行目标检测,结合改进的DeepSort算法实现跟踪,重点解决了NCNN平台部署的难点。作者详细说明了环境配置(VS2019、ncnn、OpenCV)和推理部署步骤,并分析了DeepSort算法在复杂动作场景下ID易切换的局限性。项目支持视频和摄像头输入,默

文章图片
#算法#目标检测#人工智能
在ROS环境下进行机器人建图导航(Cartographer+Movebase)、目标检测(Nanodet)、语音播报和语音导航任务发布(sherpa_onnx)。

本仓库代码用于学习ROS环境下,进行机器人建图、导航、目标检测。此外,还集成了目标检测结果播报和通过检测关键词控制机器人运动的功能。

文章图片
#机器人#目标检测#人工智能
【ROS】【TTS】在ROS中使用离线的语音合成算法,科大讯飞语音合成算法平替

创建本仓库的初衷是为了想在ROS中使用语音合成,播报目标检测的检测结果或者进行语音交互使用。但是在网上搜索一圈发现,基本上没有免费离线的TTS并且还需要注册和联网(说的就是你,科大讯飞)。本着能白嫖就白嫖的原则,便在github搜索一番,发现一个很棒的离线的TTS仓库SummerTTS,还是用C++写的,看到这个仓库之后,真的是两眼放光,立马克隆下来研究一番。十分建议在使用本仓库之前,仔细观看原仓

文章图片
#算法
使用NNI剪枝工具对VGG16网络进行剪枝,同时使用知识蒸馏对剪枝后结果进行优化。(以猫狗二分类为例)

本项目以NNI提供的官方实例为基础,尝试自己在VGG16上实现剪枝和蒸馏过程。代码编写完成并进行实际测试后发现,确实可以实现“压缩模型大小"和”保持检测精度“的效果。本项目虽然十分简单,但对于理解模型压缩原理和流程来说,有一定的参考价值。

文章图片
#剪枝#分类#算法
使用Nanodet+YoloV8-Pose实现指针仪表的实时检测、高精度读数识别(借助ncnn框架)

使用Nanodet+YoloV8-Pose实现指针仪表的实时检测、高精度读数识别(借助ncnn框架)[2024.10.16]更新:-1.指针仪表检测目标检测和关键点检测数据集:通过网盘分享的文件:指针仪表检测数据集与标注细节.zip链接: https://pan.baidu.com/s/19I3vs1c01DAdB2V3G67RlA?pwd=383j 提取码: 383j。

文章图片
#深度学习#opencv#计算机视觉
使用YoloX+DeepLabV3Plus实现仪表的检测、指针表盘分割和刻度读数识别(借助ncnn框架)

使用YoloX+DeepLabV3Plus实现仪表的检测、指针表盘分割和刻度读数识别(借助ncnn框架)GitHub链接:https://github.com/zhahoi/YoloX-DeepLabV3Plus-MeterReader。

文章图片
#深度学习#opencv#计算机视觉
[QT][NCNN][YOLOV8-SEG]使用ncnn框架部署yolov8-seg,外加qt进行界面可视化操作,用于图片和视频实例分割推理

使用ncnn框架部署yolov8-seg,外加qt进行界面可视化操作,用于图片和视频实例分割推理。

到底了