简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
好久没有写博客,今天在这里简单介绍一下我在做软件工程项目时使用Java Runtime.exec方法遇到的一些问题,希望加深大家对Runtime.exec方法的理解。首先,大家都知道,Runtime.exec(String command)函数是用来执行命令行命令的,那么是不是我把写在命令行中的命令直接复制粘贴成参数就可以了呢?事实并非如此,我们要理解这个函数的使用,要从它的源码说起。p...
本篇文章是基于台大李宏毅老师的课程写的,如有疏漏,请看原课程。https://www.youtube.com/watch?v=rl_ozvqQUU81. 什么是模仿学习?模仿学习(Imitation Learning)也被称为基于演示的学习(Learning By Demonstration)或者学徒学习(Apprenticeship Learning)。机器是可以与环境进行交互的,但...
本文主要关注于强化学习中基于策略梯度的方法。首先会简要介绍什么是策略梯度,什么是Actor-Critic算法,之后会重点讲述DDPG(Deep Deterministic Policy Gradient)算法,以及DDPG的多智能体版本:MADDG(Multi-agent Deep Deterministic Policy Gradient)。策略梯度(Policy Gradient)与基于策略梯
2019年保研基本上尘埃落定,博主最后去了北大信科读研。关于北大的夏令营,把北大往年的夏令营真题刷一刷https://blog.csdn.net/caozixuan98724/article/details/93521208,面试就个凭造化了。值得说的内容不多,反而是最早开始的南大一行,值得说的地方很多,非常有趣,作为我参加的第一个保研面试,跪的一塌糊涂。初审首先先讲lamda实验室的初审...
蒙特卡洛搜索算法是棋类博弈中常用的算法,本文介绍了蒙特卡洛搜索算法的原理,实现以及示例等内容,让读者对这一经典算法能有更加透彻的认识。
我也不知道,我为什么还要去掌握点simulink的东西,小小年级承受了生活不该承受的重担。这年头,程序员真是要啥都会啊,不然应付不了快速变化的需求。Matlab版本:R2017 a1. 创建环境点击主页中的"simulink"按钮,我们创建一个空白的环境。2. 构建电路(1)在matlab命令行中输入"powerlib",将电源,电阻,电压表啥的从弹出的窗口中拷...
A Survey of Research on Cloud Robotics and Automation摘要云是一种基础设施和广泛的互联网接入资源,有潜力为机器人和自动化系统提供巨大的好处。本次调查围绕四大潜在效益展开:1)大数据:图像、地图、轨迹和对象数据的访问存储库;2)云计算:根据统计分析、学习和运动规划的需要访问并行网格计算;3)集体机器人学习:机器人共享轨迹、控制策略和...
距离度量欧式距离(比较简单)马氏距离(复杂一些,重点要记住这些符号代表什么)明氏距离汉明距离角度相似性函数(余弦相似度)聚类聚类准则:阈值准则:根据规定的距离阈值进行判断。函数准则:利用聚类准则函数进行判断。聚类准则函数:最大最小距离算法动态聚类算法K-均值算法(还是有可能考的,后面再整理)ISODATA算法(迭代自组织分析算法)(不考)函数判别分...
题目:Dueling Network Architectures for Deep Reinforcement Learning来源:ICML 2016 Best Paper摘要在最近几年中,在强化学习中使用深度学习的表示取得了很大的成功。这些应用依然使用了比较传统的架构。比如卷积网络,LSTM或者自动编码器。在本文中,作者提出了一个新的用于model free强化学习的神经网络...
模式识别线性代数相关的知识点,包括矩阵的乘法,逆运算,逆,求解特征值和特征向量等内容。