苏向标个人主页

@qq_60489376

苏向标

2023-02-12 00:55:46 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

手搭一个大模型-part2-构建一个RAG

LLM 的底层设计机制决定了其生成的回答本质上是基于概率而非既定事实。由于 LLM 缺乏自行校准生成内容的能力，这项工作通常由人类来完成，导致只要生成的内容符合其语言逻辑，即使与事实大相径庭，LLM 也会毫不犹豫地输出。在人们看来，这就像是一本正经地胡说八道。幻觉问题难以从根源上解决，因为这种概率性也是 LLM 能展现出创新性的关键所在，但我们可以通过一些方法提高模型回答的准确性。其中RAG就是解

#人工智能 #python

手搭一个大模型part3-构建一个Agent

在人工智能领域，Agent（智能体）是指一种能够感知环境并采取行动以实现特定目标的系统或实体。本文介绍的Agent是基于ReAct框架的智能体，它结合了推理和行动能力，以高效解决复杂的语言理解和决策任务。一个标准的Agent,往往会有如下能力: 记忆(存储历史信息功能), 工具(能够调用的工具信息), 行动(即识别到该调用哪些工具后能够自主调用这些工具), 规划(收到用户指示后该怎么去处理这个问题

#python #AIGC

从零手搭一个大模型part4-手搭一个Eval评估器

首先，根据目标数据集的任务类型指定合理的评测metric.根据目标数据的形式总结模型引导prompt.根据模型初步预测结果采纳合理的抽取方式.对相应的pred与anwser进行得分计算.下面将介绍一下评估的指标"""定义大模型模块,这里之构建一个ChatGPT接口1. 先定义一个基类2. 继承,完善接口一个基类要有的方法:1. init2. Chat()

#算法 #python #人工智能

手搭一个大模型part3-构建一个Agent

#python #AIGC

从零手搭一个大模型part4-手搭一个Eval评估器

#算法 #python #人工智能

手搭一个大模型-part1-Qwen模型的介绍

介绍完Transformer和GPT模型后,接下来就是正题,手搭一个千问大模型。首先我们先看看千问大模型的结构图我们现在看主干部分,是不是很熟悉。和我们GPT模型的结构是不是很相似?现在基本上大模型都是基于GPT的结构来实现的,唯一不同的是可能对GPT每一个模块都有了一定程度的魔改,从而达到GPT模型所做不到的程度。接着我们开始介绍每一部分的实现在词向量经过了多个Decoder层堆叠后,来到了最后

#神经网络 #python #自然语言处理 +1

手搭一个大模型-part2-构建一个RAG

#人工智能 #python

手搭一个大模型-part2-构建一个RAG

#人工智能 #python

手搭一个大模型-part1-Qwen模型的介绍

#神经网络 #python #自然语言处理 +1

手搭一个大模型-part1-Qwen模型的介绍

#神经网络 #python #自然语言处理 +1

共 15 条

请选择