logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Linux服务器通过X11实现图像化界面显示

Linux服务器通过X11实现图像化界面显示背景描述​如何远程连接服务器并将图形界面输出一直是我烦恼的一个点,在实现很多项目的时候,使用matplotlib输出图像的内容是无法显示的,必须将图像保存下来查看,大大降低了项目的效率;​像一些需要实时调控的项目,例如实时的行人追踪,我们往往传入一个视频文件,并且实时对视频中的行人进行检测并输出,如果不能将检测结果输出,而是需要保存,那么不仅代码需要修改

#linux#ssh
Python——语音处理基础

Python——语音处理基础目标:Python对音频文件的IO处理;语音中关于音量和音响的一些计算;一、概述声音物理意义:声音是一种纵波,纵波是质点的振动方向与传播方向同轴的波。如敲锣时,锣的振动方向与波的传播方向就是一致的,所以声波是纵波。纵波是波动的一种(波动分为横波和纵波);通常对声音进行采样量化后,得到声音的"时间—振幅"信息;下图是用Adobe Audition打开一段音频数据:说明:图

#python#语音识别#人工智能
【模型压缩】(三)——量化

一、概述量化:剪枝是删除不重要的权重参数,量化则是减少存储权重的bit,将权重存储在更小的空间中;权重不需要以高精度方式存储,甚至不应该以高精度方式存储;如果用简单的量化方式效果并不好,需要一些训练量化参数的计较;方法:1、二值化这是最简单的一种量化方式,就是用0-1两个值代替原来的参数值,往往能达到32倍的压缩程度;该方法能够大大提升模型的训练和推理速度,但性能明显下降;也可以采用一种二值化变体

#人工智能#python
语音合成学习(一)综述

一、资料推荐爱丁堡大学课程(全英文,有能力的推荐学习一遍):https://speech.zone/courses/speech-synthesis/TensorflowTTS(比较系统的开源项目):https://github.com/TensorSpeech/TensorFlowTTS二、基础概念介绍1、时域:波形的振幅、频率;2、频域:傅里叶变换:每个复杂的波形都可以由不同频率的正弦波组成;

#语音识别#人工智能#前沿技术
【模型压缩】(一)开篇及轻量模型介绍

一、开篇​随着神经网络的发展,transformers和高级卷积网络架构给视觉和预研领域任务带来提升的同时,模型的规模及计算量也越来越大;​虽然模型的体积增大往往能带来更好的效果,但在实际场景的应用性几乎为0,这也是学术界和工业界存在的一个最大差异,模型的落地往往要考虑的方面有很多,并不只是单纯看预测的效果;模型变大引发的一些问题:更长训练时间;更长的推断时间;更多的内存占用;模型压缩的目的:以一

#计算机视觉#人工智能
【实战】基于TFlite实现TensorFlowTTS语音合成

【实战】基于TFlite实现TensorFlowTTS语音合成源码地址:https://github.com/TensorSpeech/TensorFlowTTS一、配置环境Requirements:Python 3.7+Tensorflow 2.2/2.3/2.4/2.5/2.6二、案例实现1、将源码下载并解压在TensorFlowTTS-master路径下2、下载所需要的模型和lib静态库:下

#语音识别#tensorflow#python
【实战】基于TFlite实现TensorFlowTTS语音合成

【实战】基于TFlite实现TensorFlowTTS语音合成源码地址:https://github.com/TensorSpeech/TensorFlowTTS一、配置环境Requirements:Python 3.7+Tensorflow 2.2/2.3/2.4/2.5/2.6二、案例实现1、将源码下载并解压在TensorFlowTTS-master路径下2、下载所需要的模型和lib静态库:下

#语音识别#tensorflow#python
【OpenCV学习】(十)特征点检测与匹配

【OpenCV学习】(十)特征点检测与匹配背景提取图像的特征点是图像领域中的关键任务,不管在传统还是在深度学习的领域中,特征代表着图像的信息,对于分类、检测任务都是至关重要的;特征点应用的一些场景:图像搜索:以图搜图(电商、教育领域)图像拼接:全景拍摄(关联图像拼接)拼图游戏:游戏领域一、Harris角点哈里斯角点检测主要有以下三种情况:光滑区域:无论向哪个方向移动,衡量系数不变;边缘区域:垂直边

#opencv#计算机视觉#图像处理 +1
【实战】基于TFlite实现TensorFlowTTS语音合成

【实战】基于TFlite实现TensorFlowTTS语音合成源码地址:https://github.com/TensorSpeech/TensorFlowTTS一、配置环境Requirements:Python 3.7+Tensorflow 2.2/2.3/2.4/2.5/2.6二、案例实现1、将源码下载并解压在TensorFlowTTS-master路径下2、下载所需要的模型和lib静态库:下

#语音识别#tensorflow#python
CV—BaseLine总结(从AlexNet到SENet的发展历程)

深度学习从2015年发展到现在,模型也在不断地迭代优化;现在许多新的模型往往是站在巨人的肩膀上,在这里想记录下baseline模型发展的一个历程,以及不断更新的内容;不会将模型的每一层剖开来将,而是将关键的创新点进行重点记录,当然也包括了一些个人理解和思考,如果有不对或者不全的地方欢迎沟通,也希望在以后工作中不断完善对模型的理解;BaseLine指的是什么呢?通常我们又称BaseLine模型为分类

文章图片
#深度学习#机器学习#神经网络
    共 29 条
  • 1
  • 2
  • 3
  • 请选择