logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Ubuntu 环境变量文件介绍

转自:http://blog.csdn.net/cscmaker/article/details/7261921Linux中环境变量包括系统级和用户级,系统级的环境变量是每个登录到系统的用户都要读取的系统变量,而用户级的环境变量则是该用户使用系统时加载的环境变量。所以管理环境变量的文件也分为系统级和用户级的,下面贴一个网上找到的讲的比较明白的文件介绍(略作修改)[1]:系统级:

全景视频拼接(二)--OpenCV源码解析

一、stitching_detail程序运行流程      1.命令行调用程序,输入源图像以及程序的参数      2.特征点检测,判断是使用surf还是orb,默认是surf。      3.对图像的特征点进行匹配,使用最近邻和次近邻方法,将两个最优的匹配的置信度保存下来。      4.对图像进行排序以及将置信度高的图像保存到同一个集合中,删除置信度比较低的图像间的匹配

运筹优化(十五)--应用模型之分配问题

一般分配模型一、问题描述问题描述:N个人分配N项任务,一个人只能分配一项任务,一项任务只能分配给一个人,将一项任务分配给一个人是需要支付报酬,如何分配任务,保证支付的报酬总数最小。问题数学描述:  注意,这个规划问题是整数线性规划(ILP)问题,也就是说,两个约束方程,保证每个任务被分配一次。决策变量仅允许取离散值0/1 二、实例分析---穷举法在讲将匈牙利算法解决任务...

目标检测(十六)--MS-CNN

A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detectionintro: ECCV 2016intro: 640×480: 15 fps, 960×720: 8 fpsarxiv: http://arxiv.org/abs/1607.07155github: https:...

系统学习机器学习之增强学习(四)--马尔可夫决策过程策略MC求解

1.蒙特卡罗方法(Monte Carlo methods)1. 蒙特卡罗方法的基本思想蒙特卡罗方法又叫统计模拟方法,它使用随机数(或伪随机数)来解决计算的问题,是一类重要的数值计算方法。该方法的名字来源于世界著名的赌城蒙特卡罗,而蒙特卡罗方法正是以概率为基础的方法。一个简单的例子可以解释蒙特卡罗方法,假设我们需要计算一个不规则图形的面积,那么图形的不规则程度和分析性计算(比如积分)的复...

系统学习机器学习之增强学习(五)--马尔可夫决策过程策略TD求解(SARSA)

转自:https://www.cnblogs.com/pinard/p/9529828.html1.时间差分法(temporal difference)蒙特卡洛方法,需要所有的采样序列都是经历完整的状态序列。如果我们没有完整的状态序列,那么就无法使用蒙特卡罗法求解了。本文我们就来讨论可以不使用完整状态序列求解强化学习问题的方法:时序差分(Temporal-Difference, TD)。...

图神经网络(二)--GNNs

转自:https://zhuanlan.zhihu.com/p/75307407目录一、什么是图神经网络二、有哪些图神经网络三、图神经网络的应用一、什么是图神经网络?在过去的几年中,神经网络的兴起与应用成功推动了模式识别和数据挖掘的研究。许多曾经严重依赖于手工提取特征的机器学习任务(如目标检测、机器翻译和语音识别),如今都已被各种端到端的深度学习范式(例如卷积神经网络(CNN)、长短期记忆(LST

系统学习机器学习之增强学习(一)--模型基础

转自:https://www.cnblogs.com/pinard/p/9385570.html从今天开始整理强化学习领域的知识,主要参考的资料是Sutton的强化学习书和UCL强化学习的课程。这个系列大概准备写10到20篇,希望写完后自己的强化学习碎片化知识可以得到融会贯通,也希望可以帮到更多的人,毕竟目前系统的讲解强化学习的中文资料不太多。    第一篇会从强化学习的基本概念讲起,对应...

系统学习机器学习之增强学习(三)--马尔可夫决策过程策略DP求解及参数估计

1. 值迭代和策略迭代法上节系统学习机器学习之增强学习(二)--马尔可夫决策过程我们给出了迭代公式和优化目标,这节讨论两种求解有限状态MDP具体策略的有效算法。这里,我们只针对MDP是有限状态、有限动作的情况,。* 值迭代法1、 将每一个s的V(s)初始化为02、 循环直到收敛 {对于每一个状态s,对V(s)做更新}...

系统学习机器学习之增强学习(六)--马尔可夫决策过程策略TD求解(Q-learning)

转自:https://www.cnblogs.com/pinard/p/9669263.html1. Q-Learning算法的引入        Q-Learning算法是一种使用时序差分求解强化学习控制问题的方法,回顾下此时我们的控制问题可以表示为:给定强化学习的5个要素:状态集S, 动作集A, 即时奖励R,衰减因子γ, 探索率ϵ, 求解最优的动作价值函数q∗和最优策略π∗。   ...

    共 74 条
  • 1
  • 2
  • 3
  • 8
  • 请选择