logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

目标检测经典算法集锦

目标检测经典论文集锦  目标检测目前有 one-stage 和 two-stage 两种,two-stage 指的是检测算法需要分两步完成,首先需要获取候选区域,然后进行分类,比如R-CNN系列;与之相对的是 one-stage 检测,可以理解为一步到位,不需要单独寻找候选区域,典型的有SSD/YOLO。  本文为结合相关参考博客以及原始论文进行的整理总结,相关参考引用详见文末。一、two-sta

#目标检测
强化学习(八):Dyna架构与蒙特卡洛树搜索MCTS

强化学习(八):Dyna架构与蒙特卡洛树搜索MCTS  在基于表格型强化学习方法中,比较常见的方法有动态规划法、蒙特卡洛法,时序差分法,多步引导法等。其中动态规划法是一种基于模型的方法(Model-based),因为它的前提是必须要知道所有状态和动作以及奖励的分布;后面的几种方法则是基于采样的方法,试图让智能体通过与环境交互来获得经验,从经验中推出相关的策略。因此本节对相关内容进行一个简单的总结.

R-Net:问答系统机器阅读理解

R-Net:问答系统机器阅读理解摘要:问答系统在当前学术界和工业界都非常具有研究和应用价值的任务,本文分享一篇2017年的端到端的问答系统经典之作——R-Net。该工作在当时的SQuAD1.1的测试集上达到最优结果。一、SQuAD  SQuAD是斯坦福NLP开放的一个机器阅读理解(文档问答系统)的评测数据集,最初是SQuAD1.1版本,现如今已经根据学术界的意见更新到SQuAD2.0版本。该数据集

博主最新科研论文已收录于ArXiv:利用强化学习与分层搜索提升关系抽取,欢迎阅读引用

博主最新科研论文已收录于ArXiv:利用强化学习与分层搜索提升关系抽取,欢迎阅读引用Title:RH-Net: Improving Neural Relation Extraction via Reinforcement Learning and Hierarchical Relational Searching下载地址:https://arxiv.org/abs/2010.14255Abstra

强化学习(三):有限马尔可夫决策与贝尔曼方程

强化学习(三):有限马尔可夫决策与贝尔曼方程夏栀的博客——王嘉宁的个人网站 正式上线,欢迎访问和关注:http://www.wjn1996.cn1、有限马尔可夫决策过程  有限马尔可夫决策过程(MDP)是强化学习的主要思想,也是后续多个解决强化学习目标的基本假设。  我们先来回顾一下强化学习的学习过程。强化学习的主体是智能体,与之相互交互的事物称为环境。当ttt时刻智能体所处某一个状...

强化学习(一):概述

强化学习(一):概述前言:  最近,强化学习非常的火爆,不论在科研界还是工业界,强化学习一直作为一个新兴的领域,在计算机学科范畴内发挥重要的作用。强化学习(Reinforcement Learning),属于一种机器学习架构(范式)。我们知道机器学习一般分为监督和无监督,所谓监督即是否有外在的标准来约束样本,也就是所谓的标签;无监督则是没有标签的样本。强化学习之所以认为是机器学习的一种架构,是..

AAAI2021联邦学习论文集

目前,已经开放了AAAI2021的Accept Paper List, 本文精选了14篇**联邦学习(Federated Learning)**的入选论文,分类如下:隐私保护(Private Protection)278: Secure Bilevel Asynchronous Vertical Federated Learning with Backward UpdatingQingsong Z

强化学习(七):n步自举法(多步引导法)

强化学习(七):n步自举法(多步引导法)  在之前,我们知道求解有限马尔可夫决策过程可以通过蒙特卡洛和时序差分来通过与环境多次交互从经验中学习,然而,蒙特卡洛方法在一些不满足分幕式任务或连续型任务上无法获得最终的收益,因此我们引入时序差分方法。时序差分的思想就是将下一时刻的状态价值或下一时刻的状态动作价值作为估计值,用于估计当前状态价值或动作价值。时序差分是一种结合采样和自举的方法,那么一种介于.

【预训练语言模型】CoLAKE: Contextualized Language and Knowledge Embedding(ICCL2020)

【预训练语言模型】CoLAKE: Contextualized Language and Knowledge Embedding(ICCL2020)核心要点:将文本与知识库统一为WK Graph格式,即将文本视为全连接图word graph,将文本中的entity mention检索的子图作为knowledge sub-graph,entity mention作为anchor node结合为WK

文章图片
#语言模型#自然语言处理#知识图谱
    共 103 条
  • 1
  • 2
  • 3
  • 11
  • 请选择