ArtoriaLili 个人主页

@ArtoriaLili

ArtoriaLili

2022-10-24 18:26:52 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习-DeepSeekR1

DeepSeek-R1：通过强化学习激励大语言模型的推理能力摘要我们推出了首代推理模型DeepSeek-R1-Zero和DeepSeek-R1。作为基础训练阶段，DeepSeek-R1-Zero通过大规模强化学习（RL）训练，无需监督微调（SFT），展现出卓越的推理能力。通过强化学习，该模型自然形成了诸多强大且引人入胜的推理行为。然而，其存在可读性差、语言混杂等挑战。为解决这些问题并进一步提升推

#机器学习 #人工智能

强化学习数学原理（五）——随机近似与随机

首先有个random variable(随机变量)X，我们的目标就是求出他的expectation E(x)，我们有一些iid的采样，xi，从1到n，求出均值但是如果有很多数据，我需要等很久，把所有数据都收集完成然后求平均；第二种方法是一种增量式的iincremental的方法，迭代式iterativ的方法，就是来多少，先算多少。首先针对k个，从x1一直到xk，求一个平均那我知道了wk+1，我们让

#算法 #机器学习 #人工智能

MATLAB深度学习(三)——LeNet卷积神经网络

LeNet

#深度学习 #cnn #人工智能

ROS移动机器人——ROS基础知识与编程

内容继续更新，先同步问题手册

#机器人 #自动驾驶 #人工智能

Arduino（二）——数码管显示（不同程序）

这节，我们要用一位数码管显示0~9但是在学习前，我们需要了解一些东西1.与的运算与运算0&0=00&1=01&1=11&0=0即两个同时为1 结果才为1，否则为02.或的运算或运算0|0=00|1=11|1=11|0=1即一个1 就是1，否则为02.十六位进制，二进制的对应关系000004010081000c..