logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习-DeepSeekR1

DeepSeek-R1:通过强化学习激励大语 言模型的推理能力摘要我们推出了首代推理模型DeepSeek-R1-Zero和DeepSeek-R1。作为基础训练阶段,DeepSeek-R1-Zero通过大规模强化学习(RL)训练,无需监督微调(SFT),展现出卓越的推理能力。通过强化学习,该模型自然形成了诸多强大且引人入胜的推理行为。然而,其存在可读性差、语言混杂等挑战。为解决这些问题并进一步提升推

#机器学习#人工智能
强化学习数学原理(五)——随机近似与随机

首先有个random variable(随机变量)X,我们的目标就是求出他的expectation E(x),我们有一些iid的采样,xi,从1到n,求出均值但是如果有很多数据,我需要等很久,把所有数据都收集完成然后求平均;第二种方法是一种增量式的iincremental的方法,迭代式iterativ的方法,就是来多少,先算多少。首先针对k个,从x1一直到xk,求一个平均那我知道了wk+1,我们让

文章图片
#算法#机器学习#人工智能
Arduino(二)——数码管显示(不同程序)

这节,我们要用一位数码管显示0~9但是在学习前,我们需要了解一些东西1.与 的运算与运算0&0=00&1=01&1=11&0=0即 两个同时为1 结果才为1,否则为02.或 的运算或运算0|0=00|1=11|1=11|0=1即 一个1 就是1,否则为02.十六位进制,二进制的对应关系000004010081000c..

文章图片
#c#
蓝桥杯C51_数据手册编写代码

本文章是让大家学会如何通过手册来写底层,避免了比赛时忘记代码的情况

#蓝桥杯#单片机#职场和发展
STM32(六)——定时器中断实验

接下来看看库函数是怎么使用这些寄存器的我们主要用的就是前三个在Timer.h文件里(未完成)

文章图片
#stm32#蓝桥杯#arm
    共 14 条
  • 1
  • 2
  • 请选择