
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
1.1 Kaggle-国外https://www.kaggle.com/。Kaggle是由联合创始人、首席执行官安东尼•高德布卢姆(Anthony Goldbloom)2010年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。该平台已经吸引了80万名数据科学家的关注,这些用户资源或许正是吸引谷歌的主要因素。Kaggle上的竞赛有各种分类,例如奖金极高
阿里天池:https://tianchi.aliyun.com/DataFountain:https://www.datafountain.cn/京东JDATA:https://jdata.jd.com/DC竞赛:http://www.dcjingsai.com/Kesci:https://www.kesci.com/home/competition百度大脑:https://aistudio.ba
语音识别预训练wav2vec 2.0
语音识别预训练模型Hidden-Unit BERT (HuBERT)
1 简介句子对评分任务(Pairwise sentence scoring tasks)在NLP上有非常广泛的应用,如信息检索、问答、复制问题检测、聚类等。有两种处理句子对的方法:(1)cross-encoder,两个句子同时输入到网络模型中,对输入句子对采用全注意力方法,如BERT,其有较好的表现力,却在实际场景中运行效率低、开销大。如在n=10000个句子中找到相似的句子对,BERT要进行n*
1 简介本文根据2019年《Is Word Segmentation Necessary for Deep Learning of Chinese Representations?》翻译总结,即汉语的深度学习是否有必要进行分词。英文因为其天然的用空格分割,不需要分词,而中文是连在一起的,所以存在了分词(Chinese Word Segmentation (CWS))。现在也有很多开源的分词工具。在
1 简介本文根据2020年《LOCATION-RELATIVE ATTENTION MECHANISMS FOR ROBUST LONG-FORM SPEECH SYNTHESIS》翻译总结的。基于注意力的端到端的text-to-speech (TTS) 系统尽管有能力在域内产生人类水平的语音合成,但在域外文本处理上容易出现文本对齐失败的情况。这些失败很可能是因为采用了简单的location-re
大模型微调
1 简介本文根据2018年《NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM PREDICTIONS》翻译总结的。通过标题可以看出来Tacotron 2包括Tacotron 和WAVENET。Tacotron 2是一个可以直接从文本合成语音的神经网络模型。有两部分构成,第一部分是循环序列到序列的特征预测网络,其将字符e
本博客会持续更新本目录,基本也是我目前接触到的一些知识,会继续扩展。人工智能学习1环境、命令Anaconda51.1. pip51.1.1. pip install tensorflow51.1.2. 更新 pip install --upgrade tensorflow51.1.3. pip show tensorflow51.1.4. pip install --u...







