logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从零开始的网站搭建(以照片/文本/视频信息通信网站为例)

本文面向已经有一些编程基础(会至少一门编程语言,比如python),但是没有搭建过web应用的人群,会写得尽量细致。重点介绍流程和部署云端的步骤,具体javascript代码怎么写之类的,这里不会涉及。搭建网站分为两步:首先在本地搭建网站,测试可以运行;然后把网站移动到服务器,让大家都可以访问。

文章图片
#python#flask#websocket
深度学习训练 tricks(持续更新)

本文持续更新,如果有什么你知道的深度学习模型训练技巧,可以在评论区提出,我会加进来的。

文章图片
#深度学习#人工智能
深度学习训练过程自查:为什么我的模型不收敛/表现不佳?

代码终于写完了,bug 处理好了,终于跑起来了。但是模型不收敛。或者收敛了,但是加 trick 也表现不良。于是开始思考,为什么?哪里出了问题?因此就整理了这个文章,用来辅助自查模型到底哪里出了问题。(有时候是模型结构的问题,有时候真的是因为过度关注模型结构,每次写训练代码都是套模板,不往心里去,其实是训练过程有问题)

文章图片
#深度学习#人工智能
深度学习训练 tricks(持续更新)

本文持续更新,如果有什么你知道的深度学习模型训练技巧,可以在评论区提出,我会加进来的。

文章图片
#深度学习#人工智能
hugging face transformers 库使用手册(二):调用 hugging face transformers 预训练模型进行快速预测——api: Pipeline

训练过程比预测过程多的东西:数据增广、梯度反传。虽然之多了这两个东西,但是训练的代码要比预测的代码复杂很多,所以先看简单一点的预测过程。hugging face transformers 的预测过程由Pipeline类全权代理。

文章图片
#人工智能#深度学习#机器学习
hugging face transformers 库使用手册(一):库理解和评价

最近学了 hugging face transformers 库,学成归来,把笔记整理一下,互勉。有兴趣详细了解的可以去仔细看看准备把这个写成一个小系列。不想搞太复杂,“太长不看”。但是也不想缺内容,不然用的时候抓瞎。所以先贴一个整体印象上来,对这个库的架构、怎么用有个初步的大致了解。然后再开一篇文介绍精调到底怎么操作。最后再把关键的 api 文档里的东西摘出来讲一讲。这篇就是对这个库的大体印象。

#python#pytorch#深度学习
深度学习训练过程自查:为什么我的模型不收敛/表现不佳?

代码终于写完了,bug 处理好了,终于跑起来了。但是模型不收敛。或者收敛了,但是加 trick 也表现不良。于是开始思考,为什么?哪里出了问题?因此就整理了这个文章,用来辅助自查模型到底哪里出了问题。(有时候是模型结构的问题,有时候真的是因为过度关注模型结构,每次写训练代码都是套模板,不往心里去,其实是训练过程有问题)

文章图片
#深度学习#人工智能
pytorch 训练过程内存泄露/显存泄露debug记录:dataloader和dataset导致的泄露

查找内存泄露/显存泄露的位置:把数据送入模型的代码全部注释掉,观察显存是否上涨;上涨说明内存泄露出现在dataloader(出现在非 dataloader 地方的最常见的显存泄露原因是,loss打印/统计的时候没有写把不同的 data 组成部分注释掉,观察具体是哪个 data 导致的内存泄露pytorch 释放内存的方法:把 tensor 读到 gpu 就会有显存占用,一般可以自动释放,但是显存泄

文章图片
#pytorch#人工智能#python
到底了