logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型框架LangChain开发实战(一)

你可以认为LangChain是大模型开发时代的operating system,因为它驱动了所有模块和数据的相互交互。在这样的一个框架中,有这样一个东西称作agent,目前来看agent还是一个很开放的领域,其本身的作用是基于模型驱动的做事情的具体过程,来在适当的时候使用工具或者本地数据,或者第三方数据来完成模型设定的步骤,这样的一个agent具有动态调整的过程,可以把它看成一个loop,它既能与

文章图片
#自然语言处理
Transformer应用之构建聊天机器人(一)

目前流行的聊天机器人都是基于Transformer的架构来做的,在这之前也有使用RNN网络来构建聊天机器人的例子,譬如PyTorch框架提供给我们的“Chatbot Tutorial”(本文使用前面用于语言翻译的Transformer模型来构建一个简单的聊天机器人,并与“Chatbot Tutorial”示例提供的基于RNN的GRU模型构建的聊天机器人进行对比测试,基于Transformer构建的

文章图片
#人工智能#transformer#深度学习
图像识别技术解析:手写数字识别(一)

在规范用户输入的情况下,使用机器学习的随机森林算法构建模型后,如果使用现成的数据集进行训练,得到的模型用于手写数字识别时,发现总体上识别准确率只有百分之三十左右,而新建数据集用于训练之后,识别准确率得到了很大改善,但是机器学习算法有其局限性,后面会使用深度学习中的CNN来做对比分析。当用户拖动鼠标写入数字后,点击“识别”按钮,从而通过HTTP的方式把数据发送到后端并保存起来,在实际实践中,用户的输

文章图片
#机器学习#人工智能
LLMs大模型plugin开发实战

ChatGPT是通用语言大模型,如果用户想要在与大模型进行交互时能够使用到企业私有的数据,那么可以通过开发plugin(插件)的方式来实现,另外GPT3.5模型的训练数据是截止到2021年9月,如果想让模型能够访问之后的数据,也可以借助plugin。在下面的流程图中,黄色背景框表示定制开发的plugin运行在FastAPI server上,Datastore用于存储用户文档信息,文档通过/upse

文章图片
#transformer#深度学习#自然语言处理
大模型框架LangChain开发实战(一)

你可以认为LangChain是大模型开发时代的operating system,因为它驱动了所有模块和数据的相互交互。在这样的一个框架中,有这样一个东西称作agent,目前来看agent还是一个很开放的领域,其本身的作用是基于模型驱动的做事情的具体过程,来在适当的时候使用工具或者本地数据,或者第三方数据来完成模型设定的步骤,这样的一个agent具有动态调整的过程,可以把它看成一个loop,它既能与

文章图片
#自然语言处理
LLMs大模型plugin开发实战

ChatGPT是通用语言大模型,如果用户想要在与大模型进行交互时能够使用到企业私有的数据,那么可以通过开发plugin(插件)的方式来实现,另外GPT3.5模型的训练数据是截止到2021年9月,如果想让模型能够访问之后的数据,也可以借助plugin。在下面的流程图中,黄色背景框表示定制开发的plugin运行在FastAPI server上,Datastore用于存储用户文档信息,文档通过/upse

文章图片
#transformer#深度学习#自然语言处理
Gavin老师Transformer直播课感悟 - 基于Transformer轻量级高效精确的Conversational Representation对话系统ConveRT解密(一)

一、概述本文围绕下面这篇论文来分析基于Transformer的对话系统ConveRT(Conversational Representations from Transformer的缩写)背后的机制,特别是,它是如何实现一个高效和准确的对话系统。对于现实世界AI对话系统来说,使用BERT之类的预训练语言模型的结果并不理想,因为存在计算模型笨重,训练速度慢,训练成本昂贵等缺点。论文提出的ConveR

#transformer#深度学习#人工智能
Gavin老师Transformer直播课感悟 - BERT语言模型内部机制及预训练解析

一、BERT模型概述在处理语言时,几乎所有的场景都可以认为是分类场景,所以从这个角度来说,BERT可以用于任何需要分类的场景。BERT使用命名实体识别(NER)来对组成语句的词汇、词组或者短语进行分类,对于1个NER任务,输出使用了token而不是[CLS]。 在问答场景下,问题部分和答案部分使用分隔符[SEP]进行连接,而答案有开始和结束注释。我们可以直接使用BERT模型或者可以根据需要修改它的

#transformer#神经网络#深度学习
到底了