logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

paddle-gpu是否可用

在.bashrc 文件里加上。

文章图片
#paddle
平方欧几里得距离(Squared Euclidean Distance) 和 L2 距离(欧几里得距离,Euclidean Distance)

这里梯度不会因为平方根的影响而变小,梯度的大小只与点的间距成线性关系。当 ( A ) 和 ( B ) 相距较远时,分母变大,导致梯度变小。的主要区别在于它们的计算公式、梯度特性以及在深度学习中的应用。,如果你的训练过程中梯度更新不稳定,可能会收敛较慢,可以考虑。PyTorch 默认。

#python
windows ssh连接linux系统

3、复制公钥文本内容添加到服务器端.shh目录下的authorized_keys中。2、即可生成公私钥于C:\Users\Administrator.ssh目录下。4、修改本地.ssh目录下的config文件 ,如下。1、在本机terminal生成公钥私钥文件。下面步骤可实现不用密码快捷连接。5、再次链接时直接输入。

文章图片
#linux#windows#ssh
langchain构建一个 Agent 的过程

在使用大型语言模型(LLM)时,语言模型本身无法直接采取行动,只能输出文本。LangChain 的一个重要用例是创建代理(Agents)。代理是使用 LLM 作为推理引擎的系统,用于确定应采取哪些行动以及这些行动的输入应该是什么。然后,这些行动的结果可以反馈给代理,它会确定是否需要更多行动,或者是否可以结束。在这个教程中,我们将构建一个可以与多种不同工具进行交互的代理:一个是本地数据库,另一个是搜

langchain `as_retriever` 方法

定义检索器应该执行的搜索类型。选项包括:: 默认选项,基于相似度的搜索。"mmr": 基于最大边际相关性(Maximal Marginal Relevance)的搜索。: 基于相似度分数阈值的搜索。传递给搜索函数的关键字参数,可能包括:k: 要返回的文档数量(默认值:4)。: 用于的最低相关性阈值。fetch_k: 传递给 MMR 算法的文档数量(默认值:20)。: MMR 返回结果的多样性;1

#java#服务器
LoRA微调技术文档

LoRA(Low-Rank Adaptation)是一种适用于预训练模型的微调方法,旨在通过自适应的低秩参数学习,提高模型在特定任务上的性能。LoRA 技术可以应用于各种自然语言处理(NLP)任务,如文本分类、命名实体识别、语义分割等。

文章图片
#人工智能#深度学习#机器学习
表示崩塌(representation collapse)

表示崩塌(representation collapse)是自监督学习,特别是对比学习中的一个关键问题。

#人工智能
BERT推理显存爆满?7个实用技巧教你快速优化!显存优化的最佳实践指南

即使是在推理阶段,也可以将输入数据分成较小的批次(batch),这样每次推理只处理较少的数据,从而减少显存占用。具体来说可以减小 batch size,逐步降低直到显存能够容纳。BERT 的显存占用与输入序列的长度直接相关。可以尝试裁剪输入文本,使得序列长度减少。特别是对很长的文本,可以设置合理的最大长度(如128或256),从而减少计算需求。虽然主要用于训练,但在推理时可以通过减少内存开销来节省

文章图片
#bert#人工智能#深度学习
ROUGE指标介绍

ROUGE(Recall-Oriented Understudy for Gisting Evaluation,面向提要评估的召回导向替工)是一组用于评估摘要质量的指标。通过将生成的摘要与参考摘要进行比较,ROUGE可以衡量自动摘要系统的性能,特别在自然语言处理领域中非常受欢迎。

#人工智能
    共 12 条
  • 1
  • 2
  • 请选择