logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Transformer——代码篇

序理论基本看完了,宏观认知有了,所以?开始愉快的lu代码把。参考[ 1 ]The Annotated Transformer[ 2 ]A TensorFlow Implementation of the Transformer: Attention Is All You Need[ 3 ]机器翻译模型Transformer代码详细解析...

tensorflow(2)——读取数据TFrecord

序学习这个是因为搞tensorflow肯定跳不过这个坑,所以还不如静下心来好好梳理一下。本文学完理论会优化自己以前的一个分类代码,从原来最古老的placeholder版本做一下优化——启发是来自transformer的源码,它的做法让我觉得我有必要体会一下。TFrecord注意,这里他只是一种文件存储格式的改变,前文那些队列的思想是没变的!!!简单介绍TFRecords其实...

nvidia-smi CUDA处显示 ERR!

序记一个小报错,方便他人和自己自己在docker上碰到的一个报错,最后原因: nvidia驱动和cuda版本不匹配ps: 我确定我有CUDA并且正常…我直接pull下来的好吧报错CUDA版本为 9.0正常自己为了验证想法换了一个镜像,果然成功!...

图模型一之贝叶斯网络(初版本)

0. 概率     ~~~~~     在模式识别领域的⼀个关键概念是不确定性的概念。它可以由测量的误差引起,也可以由数据集的有限⼤⼩引起。概率论提供了⼀个合理的框架,⽤来对不确定性进⾏量化和计算。     ~~~~~  &nbs

到底了