Zero_to_zero1234 个人主页

@suiyueruge1314

Zero_to_zero1234

2022-06-23 15:30:54 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

linux上安装kaldi

linux 安装 kaldi

#语音识别 #人工智能

什么是自回归和自编码语言模型？

1、自回归语言模型在ELMO／BERT出来之前，大家通常讲的语言模型其实是根据上文内容预测下一个可能跟随的单词，就是常说的自左向右的语言模型任务，或者反过来也行，就是根据下文预测前面的单词，这种类型的LM被称为自回归语言模型。GPT 就是典型的自回归语言模型。ELMO尽管看上去利用了上文，也利用了下文，但是本质上仍然是自回归LM，这个跟模型具体怎么实现有关系。ELMO是做了两个方向（从左到右以及.

使用Linux命令行上传及下载百度云盘文件（远程服务器大文件传输必备）

#服务器 #linux #运维

语音大模型速览（一）F5-TTS

本文提出了 F5-TTS，一种基于流匹配和扩散 Transformer（DiT）的全非自回归文本到语音系统，它无需复杂的时长模型、文本编码器和音素对齐，通过 ConvNeXt 优化文本表示并引入推理时的 Sway Sampling 策略，解决了 E2 TTS 收敛慢和鲁棒性低的问题，实现了更快的训练和推理（RTF 达 0.15），在 10 万小时多语言数据集上训练后，展现出高度自然的零样本能力、无

#人工智能 #深度学习

自然语言处理预处理数据迭代器及训练预测常用函数总结（fit_generator、build_model、checkpoint、predict_generator）

由于NLP相关数据处理和训练过程中，会经常用到相同代码，现常用模块进行记录，部分需要根据自己需求进行更改1、导入模块import kerasimport gensimfrom pathlib import Pathimport osimport numpy as npfrom keras.layers import *from keras.optimizers import SGD...

语音加混响

参考：https://blog.csdn.net/qq_42233059/article/details/126444994。

#python #matplotlib #机器学习

语音增强和去噪算法

博客可以看这个，很全：开源代码，参考：

#pytorch

动手学深度学习学习笔记tf2.0版（5.11 残差网络(ResNet)）

from tensorflow.keras import layers,activations# 自定义残差层class Residual(tf.keras.layers.Layer):def __init__(self, num_channels, use_1x1conv=False, strides=1, **kwargs):super().__init__...

BERT相关知识讲解（1）之 transformer

参考自：http://fancyerii.github.io/2019/03/09/transformer-codes/每个词都是有其他词的信息的，这个是 FNN 的区别与普通的 attention 相比，Query可以看作是decoder的隐状态，Key可以看作是encoder的输出，Value可以看作是encoder的输出多头其实就是多组矩阵对，每一组QKV都可以看...

动手学深度学习学习笔记tf2.0版（6.7 门控循环单元（GRU））

核心代码如下:# 从零实现 GRU，其实与 RNN 的主要区别在于有门的设计# 确定哪些是需要初始化模型参数：# 核心公式就是一下四个# Rt=σ(XtWxr+Ht−1Whr+br), Zt=σ(XtWxz+Ht−1Whz+bz)， H~t=tanh(XtWxh+(Rt⊙Ht−1)Whh+bh)， Ht=Zt⊙Ht−1+(1−Zt)⊙H~t# 初始化参数有：Ht-1 的维...

共 65 条

请选择