logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Langchain-Chatchat:打造你的本地知识库问答系统

是一个创新的问答应用,它利用了先进的langchain技术,为中文用户提供了一个友好、可离线运行的知识库问答解决方案。无论是学术研究、商业分析还是日常查询,Langchain-Chatchat都能以惊人的速度为你提供答案。“LangChain使用支持”

文章图片
#人工智能
GraphRAG:复杂查询的知识图谱新框架

用于深入理解文本数据集。在对私有数据中的复杂文本信息进行文档分析时,GrahRAG 使用 LLM 生成的知识图谱来大幅提高问答性能。这里的私有数据集是指 LLM 没有接受过训练且从未见过的数据,例如企业的专有技术文档、业务文档等。

文章图片
#知识图谱#人工智能#深度学习
世界上唯一一本全面解析Transformer的书《Transformer、BERT、GPT 大语言模型原理深度解析》太太太全面了!

此外,随着改进版Transformer架构(如Reformer、Longformer和Switch Transformer等)的出现,其在资源利用效率和处理超长序列的能力上得到了进一步优化和增强。Transformer组件详解:描述了Transformer的几个关键方面,如编码器包含六个包含自我注意力和前馈神经网络两层子层的块,而解码器同样包含六个块,但比编码器多一个用于处理编码器输出的多头注意力

文章图片
#transformer#bert#深度学习
Llama 3 大型语言模型到底是如何炼成的?

Meta 在今年 4 月开源了 Llama 3 大型语言模型,这是 Meta,也是整个行业迄今为止功能最强大的开源 LLM。那么 Meta 是如何训练 Llama 3 大型语言模型的,又在训练过程中遇到了什么问题,提出了什么新的解决方案呢?近日,Meta 在官网放出了一篇名为「」的文章,详细介绍了其中的重点和难点,让我们一起来看看,Llama 3 到底是如何炼成的。图源:Meta。

文章图片
#语言模型#人工智能#自然语言处理
大模型好书《大语言模型-基础与前沿》,看完你就是LLM大师!

本书深入阐述了大语言模型的基本概念和算法、研究前沿以及应用,涵盖大语言模型的广泛主题,从基础到前沿,从方法到应用,涉及从方法论到应用场景方方面面的内容。本书内容全面、系统性强,适合高年级本科生和研究生、博士后研究人员、讲师以及行业从业者阅读与参考。大语言模型新书重磅上市!一本书读懂大语言模型的前世今生。

文章图片
#人工智能#自然语言处理#深度学习
论文导读 | 大语言模型中应用到的强化学习算法

本文以大语言模型中应用到的强化学习算法——PPO为核心,介绍了从基础强化学习算法(策略梯度、AC等)到PPO的发展路径、核心问题及解决思路,最后简介了PPO在InstructGPT的应用。希望本文可以启发更多NLP研究者将RL更多、更好的应用在NLP的模型和场景之中。

文章图片
#算法#人工智能#自然语言处理
万字长文入门大语言模型(LLM)

本文是自己在学习LLM时,阅读《A Survey of Large Language Models》和其他相关材料时的笔记,力求对构建LLM涉及的主要环节有一个大颗粒度的全景感知,一些比较关键或者感兴趣的话题会附上一些推荐阅读的博客。希望能根据这篇博客,读者也能按图索骥式的去学习LLM。

文章图片
#人工智能#自然语言处理
入门必读!多模态大语言模型的演变全回顾!(视觉定位、图像生成、编辑、理解)

注意力算子和Transformer架构的引入使得我们可以创建大规模的,能够处理各种模态的模型。这一进步主要归因于算子的多功能性和架构的适应性。最初,它们主要应用于语言模型,但很快就扩展到支持视觉处理骨干,并最终用于集成多种模态的模型。随着复杂的大语言模型的激增,尤其是它们在上下文学习方面的能力的进步,鼓励研究人员将这些模型的范围扩大到多种模态,既作为输入又作为输出。这种扩展促使了像GPT-4V和G

文章图片
#人工智能#自然语言处理
市面上唯一一本全面解析Transformer的书《Transformer、BERT、GPT 大语言模型原理深度解析》从入门到精通,真是太太太全面了!

此外,随着改进版Transformer架构(如Reformer、Longformer和Switch Transformer等)的出现,其在资源利用效率和处理超长序列的能力上得到了进一步优化和增强。Transformer组件详解:描述了Transformer的几个关键方面,如编码器包含六个包含自我注意力和前馈神经网络两层子层的块,而解码器同样包含六个块,但比编码器多一个用于处理编码器输出的多头注意力

文章图片
#transformer#bert
杀手级AI应用前瞻,一文带你了解8个ai大语言模型

大模型已经卷到上百款了,测评下来发现像GPT、文心一言、kimi这样的AI大模型工具都有点相似。因为他们背后的核心都是数据和深度学习。它们通过分析大量的文本数据来学习语言模式,这就好像我们学习一门新语言一样,需要大量的练习和重复。所以,当它们处理类似的语言任务时,它们的反应和表现就会有一定的相似性。这些工具都是为了解决类似的问题而设计的。比如自动生成文本、翻译、理解语言意图等。所以,它们在处理这些

文章图片
#人工智能#自然语言处理
    共 427 条
  • 1
  • 2
  • 3
  • 43
  • 请选择