logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【LangChain入门 8 】基于RAG实现文档检索与问答

我们需要一个地方来存储和索引我们的分割(splits),以便后续可以对其进行搜索。如果你想构建能够对私有数据或模型介质日期后引入的数据进行推理的人工智能应用,你需要用特定信息来增强模型的知识。大语言模型可以对广泛的主题进行推理,但它们的知识仅限于训练时截止日期前公开的数据。检索适当信息,并将其插入模型提示的过程被称为检索增强生成(RAG)。:ChatModel使用包含问题和检索到的数据的提示来生成

#人工智能
【Transformers实战篇2】练习之命名实体识别

命名实体识别(Named Entity Recognition, 简称NER)是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。通常包括两部分:① 实体边界识别 ② 确定实体类别(人名、地名、机构名或其他)例:“小明在北京上班”实体类别实体地点北京人物小明。

文章图片
#nlp
【LangChain入门 10】多模态数据输入

这里的多模态模型采用, deepseek暂时不支持。

文章图片
【LangChain入门 5】工作流编排

主要介绍LCEL、Runnable interface、Stream的一些概念

文章图片
#网络
pycharm设置背景变黑和字体大小

设置背景变黑file->setting->appearance&behavior->appearance->在theme处选择darcula设置字体大小还是看百度的比较清晰http://jingyan.baidu.com/article/76a7e409de785efc3a6e1557.html打开pycharm,点击file->setting->a

理解Detectron2中数据读取以及在线数据增强流程

文章目录一、Detectron2中读取数据的流程二、读取数据、在线数据增强并显示三、Detectron2官方对数据增强部分的描述以目标检测为例,探讨Detectron2中是如何进行在线数据增强的。一、Detectron2中读取数据的流程根据cfg配置文件,建立一个Trainer(cfg)类trainer = Trainer(cfg)trainer.resume_or_load(resume=arg

大模型训练框架DeepSpeed使用入门(1): 训练设置

大模型训练的痛点是模型参数过大,动辄上百亿,如果单靠单个GPU来完成训练基本不可能。所以需要多卡或者分布式训练来完成这项工作。DeepSpeed是由Microsoft提供的分布式训练工具,旨在支持更大规模的模型和提供更多的优化策略和工具。对于更大模型的训练来说,DeepSpeed提供了更多策略,例如:Zero、Offload等。本文简单介绍下如何使用DeepSpeed。

【LangChain入门 8 】基于RAG实现文档检索与问答

我们需要一个地方来存储和索引我们的分割(splits),以便后续可以对其进行搜索。如果你想构建能够对私有数据或模型介质日期后引入的数据进行推理的人工智能应用,你需要用特定信息来增强模型的知识。大语言模型可以对广泛的主题进行推理,但它们的知识仅限于训练时截止日期前公开的数据。检索适当信息,并将其插入模型提示的过程被称为检索增强生成(RAG)。:ChatModel使用包含问题和检索到的数据的提示来生成

#人工智能
【Transformers基础入门篇7】基础组件之Trainer

Trainer是库中提供的训练的函数,内部封装了完整的训练、评估逻辑,并集成了多种的后端,如等,搭配对训练过程中的各项参数进行配置,可以方便快捷地启动模型 单机/分布式训练使用Trainer进行模型训练对模型的输入输出是有限制的,要求模型返回元组或者的子类如果输入中提供了labels,模型要能返回loss结果,如果是元组,要求loss为元组中的第一个值。

#nlp
    共 109 条
  • 1
  • 2
  • 3
  • 11
  • 请选择