logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Karpathy GPT 教程笔记(五)

Transformer 架构是当今许多先进 AI 系统的核心,它最初在 2017 年的论文《Attention Is All You Need》中被提出。GPT(Generative Pre-trained Transformer)正是基于此架构构建的。在本教程中,我们将专注于构建一个仅解码器的 Transformer,用于字符级语言建模任务。虽然我们无法复现 ChatGPT 那样的复杂系统,但通

Karpathy GPT 教程笔记(五)

Transformer 架构是当今许多先进 AI 系统的核心,它最初在 2017 年的论文《Attention Is All You Need》中被提出。GPT(Generative Pre-trained Transformer)正是基于此架构构建的。在本教程中,我们将专注于构建一个仅解码器的 Transformer,用于字符级语言建模任务。虽然我们无法复现 ChatGPT 那样的复杂系统,但通

Karpathy GPT 教程笔记(五)

Transformer 架构是当今许多先进 AI 系统的核心,它最初在 2017 年的论文《Attention Is All You Need》中被提出。GPT(Generative Pre-trained Transformer)正是基于此架构构建的。在本教程中,我们将专注于构建一个仅解码器的 Transformer,用于字符级语言建模任务。虽然我们无法复现 ChatGPT 那样的复杂系统,但通

Karpathy GPT 教程笔记(二)

神经网络是数学表达式在本课程中,我们将从零开始构建一个类似ChatGPT的Transformer语言模型。我们将使用PyTorch,在一个小型数据集(Tiny Shakespeare)上训练一个字符级的语言模型,并最终生成莎士比亚风格的文本。通过这个过程,你将深入理解现代大型语言模型(如GPT)的核心工作原理。上一节我们实现的模型仅考虑前一个字符来预测下一个字符。这种方法虽然简单,但预测效果不佳,

Karpathy GPT 教程笔记(二)

神经网络是数学表达式在本课程中,我们将从零开始构建一个类似ChatGPT的Transformer语言模型。我们将使用PyTorch,在一个小型数据集(Tiny Shakespeare)上训练一个字符级的语言模型,并最终生成莎士比亚风格的文本。通过这个过程,你将深入理解现代大型语言模型(如GPT)的核心工作原理。上一节我们实现的模型仅考虑前一个字符来预测下一个字符。这种方法虽然简单,但预测效果不佳,

Karpathy GPT 教程笔记(二)

神经网络是数学表达式在本课程中,我们将从零开始构建一个类似ChatGPT的Transformer语言模型。我们将使用PyTorch,在一个小型数据集(Tiny Shakespeare)上训练一个字符级的语言模型,并最终生成莎士比亚风格的文本。通过这个过程,你将深入理解现代大型语言模型(如GPT)的核心工作原理。上一节我们实现的模型仅考虑前一个字符来预测下一个字符。这种方法虽然简单,但预测效果不佳,

Karpathy GPT 教程笔记(二)

神经网络是数学表达式在本课程中,我们将从零开始构建一个类似ChatGPT的Transformer语言模型。我们将使用PyTorch,在一个小型数据集(Tiny Shakespeare)上训练一个字符级的语言模型,并最终生成莎士比亚风格的文本。通过这个过程,你将深入理解现代大型语言模型(如GPT)的核心工作原理。上一节我们实现的模型仅考虑前一个字符来预测下一个字符。这种方法虽然简单,但预测效果不佳,

AIGC 创意猎人(六十五)

未来的职场将因AI技术的应用而发生深刻变化,但这六种稀缺能力将始终保持其重要性。通过不断培养和提升这些能力,你将在AI时代中找到自己的独特价值,成为行业中的佼佼者。让我们一起迎接挑战,把握机遇,创造属于自己的辉煌未来。生成式AI视频技术让我们看到了创意表达的无限可能。在不久的未来,每个人都可以成为视频创作的“导演”,将自己独特的故事呈现给世界。无论是震撼的视觉大片,还是充满个性的短视频,生成式AI

AIGC 创意猎人(五十三)

├── agents/# 可选:子 Agent。├── skills/# 可选:Skills。├── .mcp.json# 可选:MCP 服务器。├── .lsp.json# 可选:LSP 服务器。├── .claude-plugin/# 必需:元数据目录。├── hooks/# 可选:事件钩子。

AIGC 创意猎人(五十三)

├── agents/# 可选:子 Agent。├── skills/# 可选:Skills。├── .mcp.json# 可选:MCP 服务器。├── .lsp.json# 可选:LSP 服务器。├── .claude-plugin/# 必需:元数据目录。├── hooks/# 可选:事件钩子。

    共 2598 条
  • 1
  • 2
  • 3
  • 260
  • 请选择