logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

论文总结《PROVENCE: EFFICIENT AND ROBUST CONTEXT PRUNING FOR RETRIEVAL-AUGMENTED GENERATION》

检索增强生成改进了大型语言模型(LLM)生成的各个方面,但是遭受由长上下文引起的计算开销以及将不相关的检索信息传播到生成的响应中。上下文修剪通过在LLM生成之前移除检索到的上下文的不相关部分来处理这两个方面。Provence 是一个高效、鲁棒性且适应性强的上下文修剪工具,适用于各种问答场景。它能够动态检测上下文中相关句子的数量和位置,并在几乎不增加计算成本的情况下,实现高效的上下文修剪。

文章图片
#剪枝#算法#机器学习 +1
论文总结《CHUNK-DISTILLED LANGUAGE MODELING》

大型语言模型(LLM)已经成为智能系统的重要组成部分,但其效率和性能仍然面临着根本性的挑战。LLM最通常基于自回归变换器,并且通常以串行方式一次生成一个分词的文本序列,这限制了它们的效率。CD-LM 通过结合深度网络和检索模块,以“文本块(chunks)”为单位进行生成,从而提高生成效率,并增强模型对新知识的适应能力。

文章图片
#语言模型#人工智能#大数据 +1
到底了