logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习训练过程自查:为什么我的模型不收敛/表现不佳?

代码终于写完了,bug 处理好了,终于跑起来了。但是模型不收敛。或者收敛了,但是加 trick 也表现不良。于是开始思考,为什么?哪里出了问题?因此就整理了这个文章,用来辅助自查模型到底哪里出了问题。(有时候是模型结构的问题,有时候真的是因为过度关注模型结构,每次写训练代码都是套模板,不往心里去,其实是训练过程有问题)

文章图片
#深度学习#人工智能
深度学习训练过程自查:为什么我的模型不收敛/表现不佳?

代码终于写完了,bug 处理好了,终于跑起来了。但是模型不收敛。或者收敛了,但是加 trick 也表现不良。于是开始思考,为什么?哪里出了问题?因此就整理了这个文章,用来辅助自查模型到底哪里出了问题。(有时候是模型结构的问题,有时候真的是因为过度关注模型结构,每次写训练代码都是套模板,不往心里去,其实是训练过程有问题)

文章图片
#深度学习#人工智能
flask 后端 + 微信小程序和网页两种前端:调用硬件(相机和录音)和上传至服务器

选择 flask 作为后端,因为后续还需要深度学习模型,python 语言最适配;而 flask 框架轻、学习成本低,所以选 flask 作为后端框架。微信小程序封装了调用手机硬件的 api,通过它来调用手机的摄像头、录音机,非常方便。网页端使用 JavaScript 调用则困难一些,走了很多弯路,在这里记录下来。前提:已经配置好 python 环境、安装了 flask;

文章图片
#flask#微信小程序#前端 +1
hugging face transformers 库使用手册(一):库理解和评价

最近学了 hugging face transformers 库,学成归来,把笔记整理一下,互勉。有兴趣详细了解的可以去仔细看看准备把这个写成一个小系列。不想搞太复杂,“太长不看”。但是也不想缺内容,不然用的时候抓瞎。所以先贴一个整体印象上来,对这个库的架构、怎么用有个初步的大致了解。然后再开一篇文介绍精调到底怎么操作。最后再把关键的 api 文档里的东西摘出来讲一讲。这篇就是对这个库的大体印象。

#python#pytorch#深度学习
hugging face transformers 库使用手册(二):调用 hugging face transformers 预训练模型进行快速预测——api: Pipeline

训练过程比预测过程多的东西:数据增广、梯度反传。虽然之多了这两个东西,但是训练的代码要比预测的代码复杂很多,所以先看简单一点的预测过程。hugging face transformers 的预测过程由Pipeline类全权代理。

文章图片
#人工智能#深度学习#机器学习
深度学习训练过程自查:为什么我的模型不收敛/表现不佳?

代码终于写完了,bug 处理好了,终于跑起来了。但是模型不收敛。或者收敛了,但是加 trick 也表现不良。于是开始思考,为什么?哪里出了问题?因此就整理了这个文章,用来辅助自查模型到底哪里出了问题。(有时候是模型结构的问题,有时候真的是因为过度关注模型结构,每次写训练代码都是套模板,不往心里去,其实是训练过程有问题)

文章图片
#深度学习#人工智能
从零开始的网站搭建(以照片/文本/视频信息通信网站为例)

本文面向已经有一些编程基础(会至少一门编程语言,比如python),但是没有搭建过web应用的人群,会写得尽量细致。重点介绍流程和部署云端的步骤,具体javascript代码怎么写之类的,这里不会涉及。搭建网站分为两步:首先在本地搭建网站,测试可以运行;然后把网站移动到服务器,让大家都可以访问。

文章图片
#python#flask#websocket
深度学习训练 tricks(持续更新)

本文持续更新,如果有什么你知道的深度学习模型训练技巧,可以在评论区提出,我会加进来的。

文章图片
#深度学习#人工智能
深度学习训练 tricks(持续更新)

本文持续更新,如果有什么你知道的深度学习模型训练技巧,可以在评论区提出,我会加进来的。

文章图片
#深度学习#人工智能
    共 15 条
  • 1
  • 2
  • 请选择