
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
通过向量场直方图算法,将轨迹跟踪产生的线速度和角速度改变,以使得车辆可以避开障碍物。此算法需要雷达的数据,用来判断我所规划的路径上是否有障碍物。如果有障碍物就在原来规划的路径上就近选择一个不会碰到障碍物的方向(也是下次要走的路径)作为新的规划路径。...
文章目录1. 数论2. 拓扑学3. 射影几何4. 常微分方程5. 非欧几何6. 计算数学7. 运筹学8. 分形几何9. 突变理论10. 模糊数学1. 数论2. 拓扑学3. 射影几何4. 常微分方程5. 非欧几何6. 计算数学7. 运筹学8. 分形几何9. 突变理论10. 模糊数学...
stateflow的chart中动作类型 entry(en),during(du),exit(ex)。进入状态A执行en:在状态A中执行du:离开状态A执行ex:
1 卷积网络的核心是:可以约减不必要的权值连接,引入稀疏或局部连接,带来权值共享策略大大地减少参数量相对的提升了数据量,从而可以避免过拟合;具有平移不变性,鲁棒性较好。卷积操作的示意图如下:卷积参数:stride:指的是窗口从当前位置到下一个位置,跳过的中间数据个数stride:zeropadding:将原始数据的周边补上0值的圈数。zeropadding:valid convolutions,s
Policy-based RL思路基于MC采样的更新方法:特点无偏但是噪声大,噪声是因为它是随机采样的,好的结果和坏的结果差距较大。解决噪声问题use temporal causality在时序上处理(REINFORCE)上式梯度更新变为下式,某时刻的奖励只与当前时刻相关,这样可以减少无必要的相关性:include a baseline再将上式变为下式,减去一个bias,这个bias可以取值为期望
价值函数近似(VFA)原因:状态太多,算力存储能力有限。只能通过插值的办法(神经网络)近似求得无法算到的状态价值函数值或状态动作价值函数值,或者是策略。如下:方法:线性拟合,神经网络,决策树,邻近算法有模型无模型两种方法来代替,1. MC;2. TDMC近似方法TD近似方法价值动作函数近似(AVFA)有模型无模型...
主要在当前运行git clone命令的目录下没有读和写的permission,去新建一个文件夹,然后在新建的文件夹里git clone即可
CUDA和NVIDIA(1)CUDA是NVIDIA推出的用于自家GPU的并行计算框架,与NVIDIA的显卡驱动是两回事。(2)NVIDIA显卡驱动和CUDA并不具有一一对应的关系,可能有多个关系,只是离线安装的CUDA工具包(CUDA ToolKit)会默认携带与之匹配的最新的驱动程序。(3)所以最好先选择安装驱动,再安装相匹配的CUDA包tensorflow和 CUDA,NVIDIA对应
在pycharm窗口中操作
文章目录前言无模型控制问题思路方法On-Policy learningMCSarsaOff-policy learningQ-learningOn-Policy learning 和 Off-policy learning的区别前言本文是学习周博雷老师的强化学习课程的心得体会。雷大佬的GItHub无模型控制问题当我们不知道 MDP 模型的情况下,如何优化价值函数,得到最佳的策略。思路这里和有模







