logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大语言模型评估测试

CMMLU和C-Eval是两个中文多学科评估基准。CMMLU包含67个主题的测试数据,主要评估中文大模型的知识和推理能力,项目结构分为src、data、script三个模块。C-Eval涵盖52个学科的13948道题目,分为4个难度等级,核心评估代码位于code/evaluator_series目录下,提供命令行参数评估功能。两个项目均开源在GitHub平台,为中文大语言模型评估提供标准化测试框架

文章图片
#语言模型#人工智能#自然语言处理 +2
Mit6.s081 Interrupts and device driver(中断和设备驱动)

摘要:xv6操作系统的控制台驱动程序通过UART硬件实现输入输出功能。控制台驱动(kernel/console.c)负责处理特殊控制字符,并通过内存映射寄存器与UART硬件交互。初始化时,consoleinit()调用uartinit()配置波特率、字符格式等参数,并注册读写函数。用户输入通过QEMU模拟的UART硬件进入系统,存储在环形缓冲区中,当检测到换行符时唤醒读取进程。该驱动实现了行缓冲机

文章图片
#算法#数据库#服务器 +3
Stanford CS336 assignment1 | Byte-Pair Encoding (BPE) Tokenizer

本文介绍了BPE(Byte Pair Encoding)算法的实现过程。首先阐述了Unicode标准与编码方式(UTF-8/UTF-16/UTF-32)的区别,然后对比了词级分词和字节级分词的优缺点。BPE作为一种子词分词技术,通过统计高频字节对进行合并,既能解决未登录词问题,又能控制词表大小。文章详细描述了BPE训练的三个步骤:初始化256字节的基本词表;预分词处理文本并统计频率;迭代合并最高频

文章图片
#开发语言#语言模型#python +3
强化学习的数学原理-03贝尔曼最优公式

时策略又会发生变化,策略会变得非常短视,更具体地说策略只会关注。求解贝尔曼最优公式就是已知红色量求出上面公式中黑色的量。有了上面的压缩映射定理就可以解决贝尔曼最优公式了。求解不动点的算法:这是一个迭代式的算法,不断令。,同时收敛的速度会非常快(以指数的速度收敛),这样导致的结果可能是采用的策略根本到达不了。这个方程,求解这个方程就需要下面的知识了。,那么贝尔曼最优公式就可以利用上面的。基于上面的定

文章图片
#人工智能#深度学习#迁移学习 +3
0x02 js、Vue、Ajax

Vue是一款用于构建用户界面的渐进式的JavaScript框架渐进式指的是可以使用vue的一部分来构建我们的页面< body > < div id = " app " > < h1 > {{ msg }} </ h1 > </ div > < script type = " module " > // 1. 导入Vue import {data() {return {

文章图片
#javascript#vue.js#ajax +4
强化学习的数学原理-03贝尔曼最优公式

时策略又会发生变化,策略会变得非常短视,更具体地说策略只会关注。求解贝尔曼最优公式就是已知红色量求出上面公式中黑色的量。有了上面的压缩映射定理就可以解决贝尔曼最优公式了。求解不动点的算法:这是一个迭代式的算法,不断令。,同时收敛的速度会非常快(以指数的速度收敛),这样导致的结果可能是采用的策略根本到达不了。这个方程,求解这个方程就需要下面的知识了。,那么贝尔曼最优公式就可以利用上面的。基于上面的定

文章图片
#人工智能#深度学习#迁移学习 +3
Floyd算法详解

在做洛谷的树上dp题单的时候遇到了一道题目P1613 跑路发现自己对flyod的理解太浅薄了,于是去重新学习了一遍,又做了几道题目,然后结合了acwing的算法提高课的总结,于是乎有了这篇博客。

文章图片
#算法#mybatis#django +4
数学基础:变分推断

摘要: 贝叶斯推断通过贝叶斯公式将先验信息与样本信息结合,得到参数的后验分布。核心公式为$\pi(\theta|x_1,...,x_n) \propto p(x_1,...,x_n|\theta)\pi(\theta)$,但高维积分计算边缘似然困难。变分推断通过优化近似分布$q(z)$逼近真实后验,最大化证据下界(ELBO)替代直接计算。传统方法如CAVI手动推导,而深度生成模型中采用神经网络参数

文章图片
#概率论#python#人工智能 +4
强化学习的数学原理-03贝尔曼最优公式

时策略又会发生变化,策略会变得非常短视,更具体地说策略只会关注。求解贝尔曼最优公式就是已知红色量求出上面公式中黑色的量。有了上面的压缩映射定理就可以解决贝尔曼最优公式了。求解不动点的算法:这是一个迭代式的算法,不断令。,同时收敛的速度会非常快(以指数的速度收敛),这样导致的结果可能是采用的策略根本到达不了。这个方程,求解这个方程就需要下面的知识了。,那么贝尔曼最优公式就可以利用上面的。基于上面的定

文章图片
#人工智能#深度学习#迁移学习 +3
机器学习实战2-决策树算法

为了将表格转化为一棵树,决策树需要找到最佳节点和最佳分支方法,对于分类数来说衡量最佳的方法是叫做不纯度,通常来说不纯度越低,决策树对训练集的拟合效果越好,所有的决策树算法都是将和不纯度相关的某个属性最优化,不管我们用那个算法,都是追求的与不纯度相关的指标最优化。这是用的最广泛的剪枝参数,在高维度低样本量时非常有效,决策树多生长一层对样本的需求量就会增加一倍,所以限制决策树的深度能够特别有效的限制过

文章图片
#机器学习#算法#决策树
    共 24 条
  • 1
  • 2
  • 3
  • 请选择