logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据增强mixup技术

目录一. mixup1. mixup方法2. mixup的讨论2.1 mixup效果如何2.2 为什么使用Beta分布2.3 参数有何影响,如何选择2.4 是否可以使用多个样本混合2.5 为什么要使用凸组合二. mixup的改进1.多种改进方法简介1.1 cutMix1.2 manifold mixup1.3 patchUp1.4 puzzleMix1.5 saliency Mix1.6 fMix

#人工智能#机器学习
莫烦强化学习视频笔记:第三节 3.2 Sarsa算法更新和思维决策(迷宫例子)

目录1. 要点2. 算法流程3. 算法代码部分3.1 迭代更新3.2 思维决策代码3.2.1 学习1. 要点这次我们用同样的迷宫例子来实现 RL 中另一种和 Qlearning 类似的算法, 叫做 Sarsa (state-action-reward-state-action). 我们从这一个简称可以了解到, Sarsa 的整个循环都将是在一个路径上, 也就是 on-policy, 下一个 sta

#算法
莫烦强化学习视频笔记:第四节 4.3 OpenAI Gym 环境库

1. 要点手动编环境是一件很耗时间的事情, 所以如果有能力使用别人已经编好的环境, 可以节约我们很多时间. OpenAI gym 就是这样一个模块, 他提供了我们很多优秀的模拟环境. 我们的各种 RL 算法都能使用这些环境. 不过 OpenAI gym 暂时只支持 MacOS 和 Linux 系统. Windows 已经支持, 但是听说还没有全面支持, 大家时不时查看下官网, 可能就有惊喜. 实在

莫烦强化学习视频笔记:第六节 6.6 Asynchronous Advantage Actor-Critic (A3C)

1. 要点一句话概括 A3C:Google DeepMind 提出的一种解决Actor-Critic不收敛问题的算法. 它会创建多个并行的环境, 让多个拥有副结构的 agent 同时在这些并行环境上更新主结构中的参数. 并行中的 agent 们互不干扰, 而主结构的参数更新受到副结构提交更新的不连续性干扰, 所以更新的相关性被降低, 收敛性提高.因为这节内容是基于Actor-Critic, 所以还

#神经网络
莫烦强化学习视频笔记:第六节 6.4 Deep Deterministic Policy Gradient (DDPG)

目录1. 要点2. 算法3. 代码3.1 主结构3.2 Actor Critic3.3 记忆库 Memory3.4 每回合算法3.5 简化版代码(录完视频后发现了小错误, 重写了代码)1. 要点一句话概括 DDPG:Google DeepMind 提出的一种使用Actor Critic结构, 但是输出的不是行为的概率, 而是具体的行为, 用于连续动作 (continuous action) 的预测

#音视频#神经网络
使用深度学习自动给图片生成文字描述

给图像加文字描述,涉及在给定的图像(例如照片)的情况下生成人类可读的文本描述。对于人类而言,这是一个容易解决的问题,但对于机器而言却非常具有挑战性,因为它既需要理解图像的内容,又需要将这种理解转化为自然语言。近年来,深度学习方法已经取代了传统方法,并针对自动生成图像描述(称为“字幕”)的问题取得了最新技术成果。在本文中,你将发现如何使用深度神经网络模型来自动生成图像描述。完成这篇文章后,你将了解:

#自然语言处理#深度学习#神经网络
使用深度学习自动给图片生成文字描述

给图像加文字描述,涉及在给定的图像(例如照片)的情况下生成人类可读的文本描述。对于人类而言,这是一个容易解决的问题,但对于机器而言却非常具有挑战性,因为它既需要理解图像的内容,又需要将这种理解转化为自然语言。近年来,深度学习方法已经取代了传统方法,并针对自动生成图像描述(称为“字幕”)的问题取得了最新技术成果。在本文中,你将发现如何使用深度神经网络模型来自动生成图像描述。完成这篇文章后,你将了解:

#自然语言处理#深度学习#神经网络
数据增强mixup技术

目录一. mixup1. mixup方法2. mixup的讨论2.1 mixup效果如何2.2 为什么使用Beta分布2.3 参数有何影响,如何选择2.4 是否可以使用多个样本混合2.5 为什么要使用凸组合二. mixup的改进1.多种改进方法简介1.1 cutMix1.2 manifold mixup1.3 patchUp1.4 puzzleMix1.5 saliency Mix1.6 fMix

#人工智能#机器学习
知识图谱的应用(一)-搜索与推荐

之前从产品经理角度写了三篇有关知识图谱的基础知识,这篇文章和以后的文章会更贴近业务层面来写一些知识图谱的商业应用。为什么要把搜索与推荐放一起,是因为这俩兄弟绑定的太深了。1. 如何理解搜索与推荐1.1 搜索从需求角度来分析,可以还原成下面的这一段话,1.A是一个用户;2.A想要找一个"thing";3.A有"thing"的某些信息,或者知道"thing"的名称等等;4.A用他个人的知识表达方式描述

#人工智能#大数据
Image Caption 常用评价指标

BLEU、Meteor、ROUGE、CIDEr 和 SPICE。前两个是评测机器翻译的,第三个是评测自动摘要的,最后两个评价 caption 的。1. Perplexity​​​​​​Perplexity其中,L是句子的长度,PPL(w_{1:L}|I) 就是根据图像 I 给出的描述句子 w_{1:L} 的 perplexity。而P(w_n|w_{1:n-1},I) 是根据图像 I 和前面的单词

#计算机视觉#自然语言处理
    共 26 条
  • 1
  • 2
  • 3
  • 请选择