
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
来源于官方函数,input_shape=[160,160,3],classes=16Layer (type)Output ShapeParam #Connected to========================================================...
哈喽大家好,上面几篇做法是提取的对数mel谱然后用VGG做embedding特征,是否靠谱不得而知,但效果很差是明显的,寡人猜测原因:1.VGG训练的数据很短,很干净,没有其他杂音;2.其他细节问题,比如参数的微调;3.其他特征??很多人骂我不分享代码,其实都是基础的东西,没有啥技术含量,这里分享下python一个版本stft【np中当然有直接的函数,这个版本也有依赖】。今天下午我有搜索下“音..
哈喽,大家好,你们深爱的小明哥又来了。emm,前提是这样的,这次接着写,克服了原来模型path的问题。但迁移学习真的有用吗?我表示怀疑,如图:这特么也是神操作,6得一批。acc越来越小。。。。。。。。。。。。。。。。如此下去,最后是0,老子也是开了眼,哪里有问题吗??ResNet也是个坑爹的玩意。【我放弃了不再等到100了,这样训练20%一大关Epoch 0004...
keras如果不能自己设置loss函数仍旧是小白一个,所以肯定要自己尝试做所有可能的事。从keras官方中文文档中发现loss的定义是y_true和y_pred的函数,也就是直接按照它的这种模式定义即可,至于数据流是怎么来的,这个问题还需要再认真考虑下,因为我的模型中的input不包含y_true,而训练的结果是两个y_pred,如何让模型知道我的输出是什么呢?这是个问题。1-首先定义我的...
鉴于上次分类结果不容乐观,故而本次增加了0视频,此次测试结果如下:一、实际是0视频,误判帧率,共200多个完整短视频视频[未切分]The total frames number=1474,error rate =0.0000The total frames number=1315,error rate =0.0274The total frames number=1472,erro...
鉴于lin大佬所写的代码只能单个图做特征,不能批处理,所以寡人修改了下。这里进行结果对比,看看是否一致。【注意是关键帧的特征】我发现lin没有resize都直接输入模型了???这个模型中必有resize的过程,只有固定一个吧。下面看看模型的输入。【后来发现为啥没有用批处理了,如果批处理,那么其input_shape必然是固定不变的,下面详细看看模型是如何reshape的,因为是pb模型...
各位大佬好!深度学习在语音方面的应用远比图像要少很多,除了众所周知的语音识别【ASR,Speech and Speaker】与语音合成【TTS】,似乎再也没有什么深度学习方面的应用了,其实这个问题很明显,本大佬从头说起,从某大佬开源图像数据集开始,语音还在数据的封闭阶段,一般人和单位根本拿不到数据,而当图像如火如荼的时候,火得不能再火的时候,语音方面的砖家才意识到革命必将来临,再不面对将失...
在RUN中找到debug,但发现没什么用,不能像VS中那样断点检测,卧槽。安卓咋打断点啊?看了几篇博文和我的都不一样,我的版本是3.5的,没有人家说的那个位置的圆点,另外还有说左键什么的根本也不行,右键结果如下:左键如下:你告诉我怎么打个断点吧,给你看看功能栏另外有相关问题可以加入QQ群讨论,不设微信群QQ群:868373192语音深度学习群...







