logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

如何训练你自己的大语言模型: 分步指南

在你开始训练LLM的旅程时,确定你的目标至关重要。这就像在开始公路旅行之前在 GPS 上设置目的地一样。你的目标是创建对话式聊天机器人、内容生成器还是针对特定行业的专用人工智能?明确目标将指导你后续的决策并塑造你的LLM的发展道路。考虑你希望LLM擅长的具体用例。你的目标是客户支持、内容创建还是数据分析?每个目标都需要不同的数据源、模型架构和评估标准。此外,请考虑你所选领域的独特挑战和要求。例如,

文章图片
#语言模型#人工智能#自然语言处理
如何训练你自己的大语言模型: 分步指南

在你开始训练LLM的旅程时,确定你的目标至关重要。这就像在开始公路旅行之前在 GPS 上设置目的地一样。你的目标是创建对话式聊天机器人、内容生成器还是针对特定行业的专用人工智能?明确目标将指导你后续的决策并塑造你的LLM的发展道路。考虑你希望LLM擅长的具体用例。你的目标是客户支持、内容创建还是数据分析?每个目标都需要不同的数据源、模型架构和评估标准。此外,请考虑你所选领域的独特挑战和要求。例如,

文章图片
#语言模型#人工智能#自然语言处理
生成式深度学习(第二版)-译文-第一章-生成式建模

生成式建模可以被宽泛的定义如下:生成式建模是机器学习的一个分支,它训练一个模型,以产生 与给定数据库高度相似的 新数据。在实际操作中,这意味着什么呢?假定我们有一个包含马匹照片的数据库。我们以此为基础可以训练一个生成式模型,该模型可以捕捉 图像中支配像素和马匹形象间复杂关系的规律。然后,我们可以从此模型中采样(sample),来生成全新的,具备真实感的马匹图像,该图像在原始的数据库中并不存在。整个

文章图片
#深度学习#人工智能#AIGC
一文理解CNN中基础核心概念

卷积神经网络 (CNN) 改变了计算机视觉,并广泛用于图像分类、对象识别和图像分割。对于初学者来说,理解这个 CNN 模型的模型架构可能会很困难,因为他们会发现一些未知的术语。我将在这里列出并描述其中一些术语,希望对您的深度学习之旅有所帮助。

文章图片
#cnn#人工智能#神经网络 +2
一文了解提示工程(Prompt Engineering)

提示是你期望 AI 模型输出的精确蓝图。它们充当中介语言,将人类意图转化为人工智能可以执行的任务。

文章图片
#AIGC#python#人工智能 +1
使用Pytorch从零开始构建LSTM

虽然 LSTM 是一种 RNN,其功能与传统 RNN 类似,但它的门控机制使其与众不同。该功能解决了 RNN 的“短期记忆”问题。从图中我们可以看出,差异主要在于 LSTM 保存长期记忆的能力。这在大多数自然语言处理 (NLP) 或时间序列和顺序任务中尤其重要。例如,假设我们有一个网络根据给我们的一些输入生成文本。文章开头提到作者有一只“名叫克里夫的狗”。在其他几个没有提到宠物或狗的句子之后,作者

文章图片
#pytorch#lstm#人工智能 +2
生成式深度学习(第二版)-译文-第七章-基于能量的模型

基于能量的模型是一大类生成式模型,其核心思想借鉴自物理系统建模 — 也即,一个事件的概率可以用玻尔兹曼分布来表达,玻尔兹曼分布是一个将实值能量函数归一化到0-1之间的特殊函数。该分布于1868年由 Ludwig Boltzmann首度提出,他将之用于描述热均衡中的气态。在本章中,我们将看看我们如何可以利用这一思想来训练一个可用于生成手写数字图像的生成式模型。我们也将探索几个新的概念,包括训练EBM

文章图片
#深度学习#人工智能#AIGC
生成式深度学习(第二版)-译文-写在前面的话

2023年以来,生成式人工智能引爆学术界和工业界,仿佛一夜之间,人人都在谈论AIGC和大语言模型。为帮助自己深入理解生成式人工智能,笔者开启了本书的翻译,仅供个人学习等非商业用途,如有商业用途需要,请联系书籍原作者。Never too late to learn, 希望自己能够坚持完!2023年10月9日。

文章图片
#深度学习#人工智能#AIGC
生成式深度学习(第二版)-译文-第十章-高级生成对抗网络 (I)

章节目标介绍了生成对抗网络(GANs),这是一类可以在一系列图像生成任务上得到经典结果的生成式模型。其在模型架构和训练过程上的灵活性让学术界和深度学习实践者持续寻找新的方法来设计和训练GANs,这直接导致本章中我们将要探索的很多不同的高级架构特性。

文章图片
#深度学习#人工智能#AIGC
生成式深度学习(第二版)-译文-写在前面的话

2023年以来,生成式人工智能引爆学术界和工业界,仿佛一夜之间,人人都在谈论AIGC和大语言模型。为帮助自己深入理解生成式人工智能,笔者开启了本书的翻译,仅供个人学习等非商业用途,如有商业用途需要,请联系书籍原作者。Never too late to learn, 希望自己能够坚持完!2023年10月9日。

文章图片
#深度学习#人工智能#AIGC
    共 23 条
  • 1
  • 2
  • 3
  • 请选择