大多_C 个人主页

@weixin_46933702

大多_C

2023-09-15 18:36:03 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

langchain文本分割器

当处理长篇文本时，将文本分割成较小的块可以更好地处理和分析。

如何解决vscode jupyter notebook插件不释放显存问题

restart notebook 即可。

在.bashrc 文件里加上。

3、复制公钥文本内容添加到服务器端.shh目录下的authorized_keys中。2、即可生成公私钥于C:\Users\Administrator.ssh目录下。4、修改本地.ssh目录下的config文件，如下。1、在本机terminal生成公钥私钥文件。下面步骤可实现不用密码快捷连接。5、再次链接时直接输入。

#linux #windows #ssh

langchain构建一个 Agent 的过程

在使用大型语言模型（LLM）时，语言模型本身无法直接采取行动，只能输出文本。LangChain 的一个重要用例是创建代理（Agents）。代理是使用 LLM 作为推理引擎的系统，用于确定应采取哪些行动以及这些行动的输入应该是什么。然后，这些行动的结果可以反馈给代理，它会确定是否需要更多行动，或者是否可以结束。在这个教程中，我们将构建一个可以与多种不同工具进行交互的代理：一个是本地数据库，另一个是搜

langchain `as_retriever` 方法

定义检索器应该执行的搜索类型。选项包括：: 默认选项，基于相似度的搜索。"mmr": 基于最大边际相关性（Maximal Marginal Relevance）的搜索。: 基于相似度分数阈值的搜索。传递给搜索函数的关键字参数，可能包括：k: 要返回的文档数量（默认值：4）。: 用于的最低相关性阈值。fetch_k: 传递给 MMR 算法的文档数量（默认值：20）。: MMR 返回结果的多样性；1

#java #服务器

LoRA微调技术文档

LoRA（Low-Rank Adaptation）是一种适用于预训练模型的微调方法，旨在通过自适应的低秩参数学习，提高模型在特定任务上的性能。LoRA 技术可以应用于各种自然语言处理（NLP）任务，如文本分类、命名实体识别、语义分割等。

#人工智能 #深度学习 #机器学习

表示崩塌（representation collapse）

表示崩塌（representation collapse）是自监督学习，特别是对比学习中的一个关键问题。

#人工智能

BERT推理显存爆满？7个实用技巧教你快速优化！显存优化的最佳实践指南

即使是在推理阶段，也可以将输入数据分成较小的批次（batch），这样每次推理只处理较少的数据，从而减少显存占用。具体来说可以减小 batch size，逐步降低直到显存能够容纳。BERT 的显存占用与输入序列的长度直接相关。可以尝试裁剪输入文本，使得序列长度减少。特别是对很长的文本，可以设置合理的最大长度（如128或256），从而减少计算需求。虽然主要用于训练，但在推理时可以通过减少内存开销来节省

#bert #人工智能 #深度学习

ROUGE指标介绍

ROUGE（Recall-Oriented Understudy for Gisting Evaluation，面向提要评估的召回导向替工）是一组用于评估摘要质量的指标。通过将生成的摘要与参考摘要进行比较，ROUGE可以衡量自动摘要系统的性能，特别在自然语言处理领域中非常受欢迎。

#人工智能

共 12 条

请选择