logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Stanford CS336 assignment1 | Byte-Pair Encoding (BPE) Tokenizer

本文介绍了BPE(Byte Pair Encoding)算法的实现过程。首先阐述了Unicode标准与编码方式(UTF-8/UTF-16/UTF-32)的区别,然后对比了词级分词和字节级分词的优缺点。BPE作为一种子词分词技术,通过统计高频字节对进行合并,既能解决未登录词问题,又能控制词表大小。文章详细描述了BPE训练的三个步骤:初始化256字节的基本词表;预分词处理文本并统计频率;迭代合并最高频

文章图片
#开发语言#语言模型#python +3
强化学习的数学原理-03贝尔曼最优公式

时策略又会发生变化,策略会变得非常短视,更具体地说策略只会关注。求解贝尔曼最优公式就是已知红色量求出上面公式中黑色的量。有了上面的压缩映射定理就可以解决贝尔曼最优公式了。求解不动点的算法:这是一个迭代式的算法,不断令。,同时收敛的速度会非常快(以指数的速度收敛),这样导致的结果可能是采用的策略根本到达不了。这个方程,求解这个方程就需要下面的知识了。,那么贝尔曼最优公式就可以利用上面的。基于上面的定

文章图片
#人工智能#深度学习#迁移学习 +3
0x02 js、Vue、Ajax

Vue是一款用于构建用户界面的渐进式的JavaScript框架渐进式指的是可以使用vue的一部分来构建我们的页面< body > < div id = " app " > < h1 > {{ msg }} </ h1 > </ div > < script type = " module " > // 1. 导入Vue import {data() {return {

文章图片
#javascript#vue.js#ajax +4
强化学习的数学原理-03贝尔曼最优公式

时策略又会发生变化,策略会变得非常短视,更具体地说策略只会关注。求解贝尔曼最优公式就是已知红色量求出上面公式中黑色的量。有了上面的压缩映射定理就可以解决贝尔曼最优公式了。求解不动点的算法:这是一个迭代式的算法,不断令。,同时收敛的速度会非常快(以指数的速度收敛),这样导致的结果可能是采用的策略根本到达不了。这个方程,求解这个方程就需要下面的知识了。,那么贝尔曼最优公式就可以利用上面的。基于上面的定

文章图片
#人工智能#深度学习#迁移学习 +3
Floyd算法详解

在做洛谷的树上dp题单的时候遇到了一道题目P1613 跑路发现自己对flyod的理解太浅薄了,于是去重新学习了一遍,又做了几道题目,然后结合了acwing的算法提高课的总结,于是乎有了这篇博客。

文章图片
#算法#mybatis#django +4
数学基础:变分推断

摘要: 贝叶斯推断通过贝叶斯公式将先验信息与样本信息结合,得到参数的后验分布。核心公式为$\pi(\theta|x_1,...,x_n) \propto p(x_1,...,x_n|\theta)\pi(\theta)$,但高维积分计算边缘似然困难。变分推断通过优化近似分布$q(z)$逼近真实后验,最大化证据下界(ELBO)替代直接计算。传统方法如CAVI手动推导,而深度生成模型中采用神经网络参数

文章图片
#概率论#python#人工智能 +4
强化学习的数学原理-03贝尔曼最优公式

时策略又会发生变化,策略会变得非常短视,更具体地说策略只会关注。求解贝尔曼最优公式就是已知红色量求出上面公式中黑色的量。有了上面的压缩映射定理就可以解决贝尔曼最优公式了。求解不动点的算法:这是一个迭代式的算法,不断令。,同时收敛的速度会非常快(以指数的速度收敛),这样导致的结果可能是采用的策略根本到达不了。这个方程,求解这个方程就需要下面的知识了。,那么贝尔曼最优公式就可以利用上面的。基于上面的定

文章图片
#人工智能#深度学习#迁移学习 +3
机器学习实战2-决策树算法

为了将表格转化为一棵树,决策树需要找到最佳节点和最佳分支方法,对于分类数来说衡量最佳的方法是叫做不纯度,通常来说不纯度越低,决策树对训练集的拟合效果越好,所有的决策树算法都是将和不纯度相关的某个属性最优化,不管我们用那个算法,都是追求的与不纯度相关的指标最优化。这是用的最广泛的剪枝参数,在高维度低样本量时非常有效,决策树多生长一层对样本的需求量就会增加一倍,所以限制决策树的深度能够特别有效的限制过

文章图片
#机器学习#算法#决策树
机器学习实战3-随机森林算法

对于随机森林这个集成算法来说,它的基评估器就是决策树,决策树长成的森林就是随机森林也就是集成评估器。

文章图片
#机器学习#算法#随机森林
Agent基础之高级检索技术rerank模型

文章摘要:Rerank模型是RAG系统中的第二阶段文档过滤器,用于对初始检索结果重新排序,提升相关性文档优先级。由于embedding模型会损失信息且仅关注召回率,而LLM存在上下文长度限制,需要更精准的相关性排序。Bi-Encoder计算快但准确度较低,Cross-Encoder精度高但耗时。两者结合使用可平衡效率与准确性,先用Bi-Encoder初筛,再用Cross-Encoder重排,优化R

文章图片
#nlp#自然语言处理#语言模型 +4
    共 22 条
  • 1
  • 2
  • 3
  • 请选择