
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
请注意,本文只是总结、归纳、整理LLM加速相关组件,并不会对这些组件进行详细的解释。在软件层面,生成器(LLM)是自回归的,在decode阶段,每次只生成下一个token,所以生成器在每次迭代时都要处理增量式的token。例如,你要使用10个token的prompt去生成100个token,并不意味着仅仅使用109个token去迭代,而是10+11+12+13+…+109=5950个token。所
MindIE下的atb-model源码库(修正function call),改正后,可支持流式和非流式推理

机器学习——特征工程之分类变量前言分类变量的编码1、one-hot 编码2、虚拟编码3、效果编码处理大型分类变量1、特征散列化2、分箱计数总结前言关于特征工程,已经对空值、数值型和文本数据的处理做了大致方法的说明,这篇对数据类型中的另一大重要部分——分类变量,作处理方法总结。声明:关于编程语法相关问题不会展开论述,本文只针对方法路线分类变量的编码先说明什么样的数据被称为分类变量:分类变量...
传统机器学习——特征工程之数值处理前言二值化区间量化(分箱)1.固定宽度分箱前言书接上文,前面两篇介绍了关于空值的处理,这篇开始用不同手段细化处理过程,本篇将会介绍数值型数据的二值化、区间量化(分箱)、对数变换、指数变换、特征缩放\归一化、交互特征、特征选择。(注:为了只操作在一个数据集上,有些原理在其上的应用可能比较生硬)声明:关于编程语法相关问题不会展开论述,本文只针对方法路线。二值...
机器学习——回归算法之最小角回归(Least angle regression, LARS)前言算法思想示例代码前言最小角回归涉及到了相关系数(current correlations),但这里并不会具体定义相关系数的定义,只需要在知道它是用来衡量两个变量相关程度的就可以了。算法思想这里用一张图来说明算法的基本思想:从简单的情况说明,假设有两个样本x1和x2,真实标签为y2^(图中绿色的...
一直想总结下目标检测的一系列算法,分为两个主要路线,一个是从RCNN发展起来的两阶段算法,另一个是以YOLO发展的一阶段算法。本篇属于RCNN算法中重要的一部分,用来解决生成候选区域的问题,算是基础,也很重要,尽管该算法已经过时了,但是掌握其中的思想用来解决可以问题还是不错的。简述作用:在原图片上,以尽可能快和好地生成可能包含目标的候选块。换句话说,避免了穷举法的计算量大且无图像本身信息的缺点。解
数据挖掘——时间序列算法前言一、平滑法1、简述2、移动平均法2.1、简单移动平均2.2、加权移动平均法3、指数平滑法前言时间序列是许多数据挖掘任务重最常见的类型之一,同时也比较难处理。这篇记录下我所理解下的时间序列模型的算法。注意,这不是特征工程,而是算法(暂时是这样理解的,毕竟目前还没使用过这些方法做特征工程)。一、平滑法1、简述所谓时间序列平滑预测是指用平均的方法,把时间序列中的随机...
机器学习——特征工程之数据降维:低维嵌入(一)前言低维嵌入(MDS)主成分分析(PCA)前言前面关于特征工程已经可以将大部分数据集转成期望的纯数字形式,但是有时数据维数太多会造成维数灾难,,所以需要降维。降维有几种方法:低维嵌入(MDS)、主成分分析(PCA)、线性判别分析(LDA)、核化线性降维(KPCA)、局部线性嵌入(LLE)、SVD。如果有可能,会一一说明(此部分内容大部分来自西瓜书)..
机器学习——回归算法之正交匹配追踪算法(Orthogonal Matching Pursuit,OMP)前言匹配追踪算法(Matching Pursuit,MP)1、算法思想2、算法过程3、MP算法的问题正交匹配追踪算法(Orthogonal Matching Pursuit,OMP)1、算法思想2、算法流程3、代码前言学习正交匹配追踪算法之前需要看懂匹配追踪算法(MP),显然OMP是在MP的..
机器学习——特征工程之数据相关性前言图表相关性协方差和协方差矩阵代码实现相关系数1、皮尔逊相关系数( Pearson correlation coefficient)2、斯皮尔曼相关性系数、秩相关系数(spearman correlation coefficient)3、Kendall Rank(肯德尔等级)相关系数信息熵和互信息前言在样本属性很多的数据集中,一定会存在一些与标签关系不那么强的..







