logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于OneAPI+ChatGLM3-6B+FastGPT搭建LLM大语言模型知识库问答系统_oneapi 404

这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。取一个

文章图片
#oneapi#语言模型#人工智能 +1
从传统 RAG 到图 RAG,赋予大型语言模型更强大的知识力量

大型语言模型 (LLMs) 在固定数据集上进行训练,其知识在最后一次训练更新时就已固定。ChatGPT 的常规用户可能已经注意到其众所周知的局限性:“这种局限性会导致模型产生不准确或过时的响应,因为它们会“”信息。在不重新训练或微调的情况下,用新信息更新模型或增强其上下文理解能力,在资源和人力方面都极具挑战。

文章图片
#语言模型#人工智能#自然语言处理 +1
【Python大语言模型系列】如何在LangChain中使用ReAct构建AI Agent(案例+源码)

当前,在各个大厂纷纷卷LLM的情况下,各自都借助自己的LLM推出了自己的AI Agent,比如字节的Coze,百度的千帆等,还有开源的Dify。你是否想知道其中的原理?是否想过自己如何实现一套AI Agent?当然,借助LangChain就可以。ReAct(Reasoning and Action)是一个框架,其核心思想,就是通过思维链的方式,引导模型将复杂问题进行拆分,一步一步地进行推理(Rea

文章图片
#人工智能#python#语言模型 +1
LangChain入门:用Python构建大语言模型应用的完整指南

LangChain是一个开源框架,专门用于构建基于大语言模型的应用。它提供了一套工具和组件,帮助开发者更高效地处理文本生成、问答、对话系统等任务。无论是构建智能客服、自动化文档生成,还是开发个性化的聊天机器人,LangChain都能为你提供强大的支持。LangChain为构建大语言模型应用提供了一个强大而灵活的工具集。通过它,可以轻松实现文本生成、问答、对话系统等功能,并将其应用到实际场景中。千里

文章图片
#python#语言模型#自然语言处理 +1
没有提示的COT(Chain of Thought)推理:解锁大型语言模型的内在能力

没有提示的 COT 是指在 AI 处理任务时,不依赖预先设定的明确提示或指令,而是让模型自身基于其训练数据和算法,自动生成逻辑推理步骤来解决问题。传统的 COT 往往需要在输入中提供一定的引导信息,帮助模型理解任务和构建思维链。但在没有提示的 COT 中,模型需要凭借自身的 “智能” 来启动和执行思维过程。

文章图片
#语言模型#人工智能#自然语言处理
深入浅出LLM大语言模型

2022年末,聊天程序ChatGPT的上线,在短短5天被注册用户就破百万。ChatGPT的爆火,在一夜之间,带领人类穿越到了真正的人工智能时代。本文会从ChatGPT作为切入点,在介绍其底层的GPT模型诞生史后,再深入浅出地讲解大语言模型(LLM)及工作原理。在整篇文章中,从点到面到又介绍了自然语言处理(NLP)、深度学习、Transformer模型等,让你对LLM和AI领域有更加清晰透彻的理解。

文章图片
#语言模型#人工智能#自然语言处理 +3
大型语言模型 (LLM) 初学者指南_讲解大语言模型如何做引入

我们在日常生活中经常看到令人兴奋的LLM申请。您想知道如何构建 LLM 申请吗?以下是构建 LLM 申请的 3 种方法:利用 Scratch 训练大语言模型训练大型语言模型提示。

文章图片
#语言模型#人工智能#自然语言处理
一文详解大语言模型的流行架构与训练技术

这篇博客全面介绍了大型语言模型(LLMs)的构建流程,从流行架构的选择到实际建模的每个关键步骤。文章首先探讨了LLMs的模型架构,然后详细阐述了数据准备过程,包括数据的收集、清洗和去重,接着是关于如何进行有效标记化的讨论。在模型构建方面,博客详细解释了采用自监督学习方法的预训练过程,以及对模型进行指令微调和对齐的重要性。每个环节都被细致地讲解,使读者能够深入理解LLMs的构建和优化过程。这篇博客为

文章图片
#语言模型#架构#人工智能 +1
面向大语言模型的检索增强生成(RAG)技术:综述

随着 LLMs 的潜力被进一步开发,旨在提升模型的可控性并满足不断演变的需求,RAG 的研究逐渐聚焦于增强推理能力,并且也探索了在微调过程中的各种改进方法。随着 RAG 技术的进一步发展和演变,新的技术突破了传统的 Naive RAG 检索 — 生成框架,基于此我们提出模块化 RAG 的概念。表中汇总了如何将传统量化指标应用于 RAG 评估以及各种 RAG 评估框架的评估内容,包括评估的对象、维度

文章图片
#语言模型#人工智能#自然语言处理 +1
AI大模型入门基础教程(非常详细),AI大模型入门到精通,收藏这一篇就够了!_大模型开发工程师要学哪些课程

AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力,可以应用于各种领域,如自然语言处理、图像识别、语音识别等。

文章图片
#人工智能#语言模型
    共 475 条
  • 1
  • 2
  • 3
  • 48
  • 请选择