
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
COMAKE PID1开发板是一款基于SSD2355芯片的AIOT开发平台,搭载四核ARM Cortex-A35处理器(最高1.5GHz)。该开发板支持16bit 8Gbit DDR4内存、双频WiFi6/BLE5.2、双百兆网口、5寸MIPI显示屏(2560*1600@60fps)、多路音频接口(3路AMIC/8路DMIC输入)和丰富扩展接口(40pin GPIO、USB2.0、MIPI传感器接

文章摘要:本文介绍了IPU-Toolchain模型推理流程及Simulator工具的使用方法,包括浮点/定点网络模型的推理步骤、工具参数配置(如图片输入、模型路径、预处理等)以及远程开发板推理操作。详细说明了Simulator的必选/可选参数功能,并提供了板端RPC服务连接、网络测试及内存优化方案。最后指引用户访问Comake开发者社区获取更多资源。全文约150字。

本文详细介绍了IPU工具链中模型转换的完整流程,主要包括:1. 模型转换配置文件input_config.ini的编写指南,涵盖输入输出配置、量化参数设置等核心内容;2. 前处理脚本的编写规范,针对不同数据格式(RGB/BGR/GRAY/RAWDATA等)提供了具体示例;3. 使用SGS_converter工具将原始模型转换为端侧离线模型的完整方法。其中重点说明了ONNX框架作为主力支持平台的优势

ALSA音频测试程序说明摘要(150字) 本程序用于测试Comake PID1开发板的ALSA音频接口,支持录音、播放、直通模式,支持AMIC/DMIC/I2S/回声测试,可设置增益与音量。程序默认存放于板端/customer/sample_code/audio_ai_ao_demo目录,若需重新编译需配置工具链并执行整包编译。使用时需注意板载麦克风/扬声器连接方式及DMIC引脚配置。通过命令行参

本文介绍了IPU-Toolchain模型精度问题的调试方法,主要分为三类问题:原始框架模型与Float.sim模型精度问题、Float.sim与Fixed.sim模型精度问题、板端精度问题。针对不同问题阶段,提供了详细的调试工具和步骤,包括如何运行原始模型、dump各层数据、使用auto_dump_debug.sh脚本分析精度差异、检查前处理、修改量化参数等方法。特别强调了在调试过程中要注意文件保

本文介绍了sigmastar 平台 IPU Toolchain StarShuttle快速入门的流程,包含教学视频,供大家参考

本次开源的声音事件检测算法来源于Aibaba开源的语音算法仓库, 具有轻量级、稳定性高等特点。接下来详细介绍如何在sigmstar D1ssd2355开发板上如何部署的详细步骤。

语音分离是指从混合的音频信号中提取出独立的语音源, 例如, 在多人会议录音中, 分离出每个说话人的声音。 本次开源的语音分离算法来源于SpeechBrain发布的Pytorch开源工具包, 该工具包集成了多种先进的音频处理技术, 详情可参考Speechbrain官方说明,可以进一步的参考该文章实战起来。

MobileSAM是一种针对移动设备优化的轻量级图像万物分割模型, 能够实现对任意物体的识别与分割。它是在SAM(Segment Anything Model)基础上进行优化的, 旨在保持高质量分割结果的同时, 降低计算复杂度和内存占用, 以便在资源受限的移动设备上能够高效运行

¶vits是一个端到端的语音合成算法, 它使用预先训练好的语音编码器直接将文本转换为语音, 无需额外的中间步骤或者特征提取。https://pan.baidu.com/s/1pN-wL_5wB9gYMAr2Mh7Jvg, 密码:vits。