logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

用python实现基于PANN(retrained Audio Neural Networks)的声音检测方法

用python实现基于PANN的声音事件检测方法1.PANN国外论文:《PANNs: Large-Scale Pretrained Audio Neural Networks for Audio Pattern Recognition》在本文中,我们提出了在大规模音频集数据集上训练的预先训练的音频神经网络(PANNs)。这些面板被转移到其他与音频相关的任务中。我们研究了由各种卷积神经网络建模的粒子

#python
单通道说话人语音分离——Conv-TasNet(Convolutional Time-domain audio separation Network)

在真实的声学环境中,鲁棒的语音处理通常需要自动的语音分离。由于这一研究课题对语音处理技术的重要性,人们已经提出了许多方法来解决这一问题。然而,语音分离的准确性,特别是对新演讲者,仍然不够。

文章图片
#人工智能#深度学习
python+opencv+opencv-contrib 人脸识别

python+opencv+opencv-contrib 人脸识别1.环境安装①python3.7②opencv③opencv-contrib2.准备样本大概准备5-6个人的人脸图,每个人大概10-20副图这里我上网百度随便找了爱情公寓里面的人当材料,如若侵权,立刻删除3.训练样本def encode_face(path_name):# grab the paths ...

#python#opencv#人脸识别
基于科大讯飞星火大模型Spark 4.0 Ultra的微信聊天机器人搭建教程

目前,办公场景中,员工需要与不同的人交谈,而微信作为其中的桥梁。随着如今工作越来越繁重,面对不同的人进行交谈已经是应接不暇,急需一个AI聊天机器人来帮助人们从繁忙的聊天中解放出来。

文章图片
#spark#微信#机器人
统计学习方法——第1章(个人笔记)

统计学习方法——第1章 统计学习及监督学习概论《统计学习方法》(第二版)李航,学习笔记1.1 统计学习1.特点(1)以计算机及网络为平台,是建立在计算机及网络上的;(2)以数据为研究对象,是数据驱动的学科;(3)目的是对数据进行预测与分析(4)以方法为中心,构建模型并应用模型进行预测与分析;(5)是概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科,并且在发展中逐步形成独

#机器学习
统计学习方法——第9章 EM算法及其推广(个人笔记)

统计学习方法——第9章 EM算法及其推广(个人笔记)参考《统计学习方法》(第二版)李航EM算法是一种迭代算法,每次迭代由两步完成:E步,求期望;M步,求极大。9.1 EM算法的引入概率模型有观测变量,又含有隐变量或潜在变量。EM算法就是含有隐变量的概率模型参数的极大似然估计法,或极大后验概率估计法。9.1.1 EM算法例子(三硬币模型)假设有三枚硬币,分别记作A,B,C,这些硬币正面出现的概率分别

#算法#学习#概率论
统计学习方法——第10章 隐马尔可夫模型(个人笔记)

统计学习方法——第10章 隐马尔可夫模型(个人笔记)参考《统计学习方法》(第二版)李航10.1 隐马尔可夫模型的基本概念10.1.1 隐马尔可夫模型的定义定义10.1(隐马尔可夫模型)隐马尔科夫模型是关于时序的概率模型,描述由一个隐藏的马尔科夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测从而产生观测随机序列的过程。隐藏的马尔科夫链随机生成的状态序列,称为状态序列(state sequ

#学习#机器学习
统计学习方法——第5章 决策树(个人笔记)

统计学习方法——第5章 决策树(个人笔记)参考《统计学习方法》(第二版)李航决策树的学习包括三个步骤:特征选择、决策树的生成、决策树的修剪。5.1 决策树模型与学习5.1.1 决策树模型决策树由结点和有向边组成。结点有两种类型:①内部结点:内部结点表示一个特征或属性。②叶节点:叶结点表示一个类。用决策树分类:从根结点开始,对实例的某一特征进行测试,根据测试结果,将实例分配到其子结点;这时,每一个子

#机器学习
自监督学习之掩码自动编码器(Masked Autoencoders, MAE)——音频识别方面

在这项工作中,主要研究了听的方面,即音频识别方面,如Audioset(规模最大的音频数据集),环境声识别(ESC-50),语音指令识别(SPC-2, SPC-1),说话人识别(VoxCeleb)。

文章图片
#人工智能
    共 30 条
  • 1
  • 2
  • 3
  • 请选择