logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从零开始学LangChain(5):Chain模块

链定义为对组件的一系列调用,也可以包括其他链,这种在链中将组件组合在一起的想法很简单但功能强大,极大地简化了复杂应用程序的实现并使其更加模块化,这反过来又使调试、维护和改进应用程序变得更加容易。Chain基类是所有chain对象的基本入口,与用户程序交互,处理用户的输入,准备其他模块的输入,提供内存能力,chain的回调能力,其他所有的 Chain 类都继承自这个基类,并根据需要实现特定的功能。p

文章图片
#python#windows#人工智能 +2
一种基于滑动窗口扩展上下文的RAG(检索增强生成)优化实现方案实践

RAG(检索增强生成)是一种结合了检索(通常是知识库或数据库)和生成模型(大语言模型)的技术,目的是在生成文本的时候能够参考相关的外部知识。这样,即使生成模型在训练时没有看到某些信息,它也能在生成时通过检索到的知识来生成更加准确和丰富的回答,这篇文章实现一种基于动态上下文窗口的方案,能够处理大规模文档,保留重要的上下文信息,提升检索效率,同时保持灵活性和可配置性。

文章图片
#人工智能#职场和发展#transformer +1
从零开始学LangChain(2):LLM输入输出管理

LangChain 主体分为 6 个模块,分别是对(大语言)模型输入输出的管理、外部数据接入、链的概念、(上下文记忆)存储管理、智能代理以及回调系统,通过文档的组织结构,你可以清晰了解到 LangChain的侧重点,以及在大语言模型开发生态中对自己的定位。从本节开始我将对langchian各个模块对照源码进行介绍,首先看Model I/O模块👇。

文章图片
#java#服务器#人工智能 +2
大模型新贵还是绕不过云计算大佬

值得关注的是,Amazon Bedrock 的模型评估工具全面可用,能够根据特定应用场景的指标(如相关性、风格和品牌声音)对模型进行评估,为客户评估、比较和选择适合其应用程序的最佳模型,将评估模型的时间从几个星期缩短到几个小时,评估后还会提供评估报告,为更多模型使用者提供参考。Amazon Bedrock对外发布已有一年,过去一年,大模型依然在不断迭代,甚至迭代得有些过于快速,以至于企业客户不知道

文章图片
#云计算#科技#人工智能
通义千问1.5(Qwen1.5)大语言模型在PAI-QuickStart的微调与部署实践

Qwen1.5(通义千问1.5)是阿里云最近推出的开源大型语言模型系列。作为“通义千问”1.0系列的进阶版,该模型推出了多个规模,从0.5B到72B,满足不同的计算需求。此外,该系列模型还包括了Base和Chat等多个版本的开源模型,为全球的开发者社区提供了空前的便捷性。阿里云的人工智能平台PAI,作为一站式的机器学习和深度学习平台,对Qwen1.5模型系列提供了全面的技术支持。无论是开发者还是企

文章图片
#语言模型#人工智能#自然语言处理
【AI大模型】从零开始运用LORA微调ChatGLM3-6B大模型并私有数据训练

ChatGLM3是智谱AI和清华大学 KEG 实验室联合发布的对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上,ChatGLM3-6B 引入了如下特性:ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了更多样的训练数据、更充分的训练步数和更合理的训练策略。

文章图片
#人工智能#gpt-3#科技 +2
惊艳超越Claude-2.1和GPT-3.5-Turbo,Qwen1.5还藏了哪些黑科技?32K Tokens上下文支持只是开胃菜!

为了深入了解Qwen1.5的实力,我们对其基础和聊天模型进行了全面评估。从语言理解到代码、推理,每一项基础能力都经过严格测试。多语言处理、符合人类喜好、智能体能力,还有检索增强生成,它都游刃有余。在MMLU、C-Eval等知名数据集上,Qwen1.5大显身手,尤其72B版本,更是远超Llama2-70B。数学、推理,对它来说都是小菜一碟。小模型也火热,我们拿Qwen1.5的小参数版本和市面上的佼佼

文章图片
#gpt-3#科技#人工智能 +3
到底了