logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大语言模型应用指南:以ChatGPT为起点,从入门到精通的AI实践教程

在20世纪末和21世纪初,人类经历了两次信息革命的浪潮。第一次是互联网时代的兴起,将世界各地连接在一起,改变了人们获取信息和交流的方式。第二次则是移动互联网时代的到来,智能手机和移动应用程序的普及使人们可以随时随地与他人交流、获取信息和进行商务活动。然而,随着技术的不断演进和人类社会的不断发展,我们正站在另一个信息时代的门槛上。这是一个更加智能化、更加联系紧密的时代,它将重新定义我们与世界互动的方

文章图片
#人工智能#语言模型#架构 +2
5个步骤掌握大语言模型:从基础到应用!

自动生成文本的简短摘要,便于快速获取信息。5.

文章图片
#语言模型#人工智能#自然语言处理 +4
大语言模型(LLMs)经典论文清单!

要说2023刷屏最多的词条,ChatGPT可以说是无出其右。到最近的GPT-4,技术的革新俨然已呈现破圈之势,从学术圈到工业界再到资本圈,同时也真切逐步影响到普通人的日常生活与工作。坦白来讲,对于大语言模型生成相关的工作,个人长期以来持保守态度,认为这个方向更多的是一种深度学习的理想追求。现在看小丑竟是我自己,也许优秀的工作正是需要对理想状态的持续追求,才叫优秀的工作。

文章图片
#语言模型#人工智能#自然语言处理 +3
大语言模型(LLM)训练入门

通过这篇文章,你可以预训练一个全新大语言模型。全新训练的好处是训练的数据、训练的参数都是可修改的,通过调试运行我们可以更好的理解大模型训练过程。我们可以用特定类型数据的训练,来完成特定类型数据的输出。关于大模型已经有很多文章,微调模型的文章比较多,全新预训练全新模型的文章很少。有的也讲的很复杂,代码也很难跑通。本文不会讲的很复杂,代码也很容易运行。

文章图片
#语言模型#深度学习#人工智能 +4
从零基础到精通大语言模型(1)N-gram

N-gram 是一组由 N 个连续单词组成的片段。例如,在句子 “I love natural language processing” 中,2-gram 是 (“I love”, “love natural”, “natural language”, “language processing”)。

文章图片
#语言模型#人工智能#自然语言处理 +2
LLM 教程 1 —— 大语言模型入门

本文将介绍大语言模型的重要性,它们如何被训练,应用场景,面临的挑战与风险,以及未来发展方向。阅读完毕后,您将对大语言模型的潜力和能力有更深入的理解。1、大语言模型是什么?大语言模型(LLM)是一种能够执行多种自然语言处理任务的机器学习模型,包括生成文本、分类文本、以对话方式回答问题以及文本翻译等。这类模型利用 Transformer 模型和大量数据集进行训练,因此被称为“大”。这让它们能够识别、翻

文章图片
#语言模型#人工智能#自然语言处理 +4
个人从零开始打造大语言模型?攻略都在这里了!

首先,给出一个学习清单:构建大语言模型(LLM)所需知识与资源清单1.基础知识与技能编程语言:Python深度学习库:TensorFlow, PyTorch算法知识:自然语言处理(NLP),机器学习,深度学习2.推荐书籍《深度学习》 by Ian Goodfellow, Yoshua Bengio, and Aaron Courville《自然语言处理综论》 by Christopher Mann

文章图片
#语言模型#人工智能#自然语言处理 +3
大语言模型从零开始训练全面指南:预训练、Tokenizer训练、指令微调、奖励模型、强化学习

在这篇文章中,我们将尽可能详细地梳理一个完整的 LLM 训练流程。包括模型预训练(Pretrain)、Tokenizer 训练、指令微调(Instruction Tuning)、奖励模型(Reward Model)和强化学习(RLHF)等环节。

文章图片
#语言模型#人工智能#自然语言处理 +2
LLM大模型部署的最佳实践

大型语言模型 (LLM) 彻底改变了自然语言处理和理解领域,实现了跨各个领域的广泛人工智能应用。然而,在生产中部署 LLM 应用程序也面临着一系列挑战。在部署 LLM 应用程序时,成本和延迟考虑至关重要。较长的提示会增加推理成本,而输出的长度会直接影响延迟。在整合LLM时可以采用不同的方法,例如提示、微调和提示调整。提示是一种快速简单的方法,只需要几个示例,而微调可以增强模型性能,但需要更大的数据

文章图片
#人工智能#web安全#安全 +2
一文解析大语言模型LLM的幻觉问题:消除错觉、提高认知

在人类的感知和认知过程中,幻觉一直是一个被广泛讨论和研究的问题。幻觉指的是一种虚假的感知或认知经验,使我们看到、听到或感受到不存在的事物或事件。无论是在科学领域还是日常生活中,幻觉都引发了极大的兴趣和好奇心。为了更好地了解幻觉的产生机制和解决方法,我们迫切需要深入探索这个领域。随着人工智能技术的迅猛发展,大语言模型(LLM)在各个领域展现出了惊人的能力和潜力。然而,正如人类一样,LLM也会面临幻觉

文章图片
#语言模型#数据库#人工智能 +4
    共 678 条
  • 1
  • 2
  • 3
  • 68
  • 请选择