m0_60388871 个人主页

@m0_60388871

m0_60388871

2022-11-10 15:56:14 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

用通俗易懂的方式解释强化学习

每当狗因为某个特定的动作而得到奖励时，它就会学习到：“哦，原来当他们说‘坐下’时，我做这个动作就能得到食物。这个过程中，它不仅要重复那些曾经获得奖励的行动，还要不时尝试新的行动，以防有更好的解决方案尚未被发现。电脑在学习过程中也是这样，通过尝试各种可能的行动，看看哪些行动能得到奖励。每当狗正确执行了命令（即学习到了正确的动作），我们就给它一些奖励，比如说食物或者夸奖。在电脑学习的过程中，这个奖励是

人工智能领域包含许多大类，每个大类下都有许多子领域。以下是人工智能主要的大类以及每个大类下的一些子领域：(仅供参考)

#人工智能

一些常见的机器学习模型

#机器学习 #人工智能

为什么Rotary Position Embedding（RoPE）是在query和Key上进行？

注意力分数的计算依赖QKTQK^TQKT：RoPE 通过旋转QQQ和KKK，使注意力分数直接编码相对位置信息。内容与位置分离QQQ和KKK负责位置建模，VVV保留原始内容信息，避免干扰。计算效率：仅对QQQ和KKK应用 RoPE，减少不必要的计算开销。相对位置建模：RoPE 的设计天然适合捕捉m−nm - nm−n，通过QKTQK^TQKT实现。一致性与标准：Transformer 模型普遍将位置

DeepSpeed zero1，zero2，zero3和FSDP区别详解

ZeRO是由Microsoft DeepSpeed团队开发的一种内存优化技术，旨在通过分片模型状态来训练超大模型，减少每个GPU的内存占用，同时避免传统模型并行（如张量并行或流水线并行）所需的代码修改。ZeRO分为三个阶段（Stage 1、Stage 2、Stage 3），每阶段逐步增加分片的范围，从而进一步降低内存需求。FSDP是PyTorch提供的分布式训练框架，灵感来源于ZeRO Stage

一款插件让你的chatgpt对话完美显示在Word与Markdown编辑器

通过这个插件，用户可以轻松地将 ChatGPT 网站上的聊天记录转换为 Markdown 格式，从而更方便地分享、编辑和存档他们的对话。这个 Chrome 插件旨在帮助用户将 ChatGPT 网站上的聊天记录导出为标准的 Markdown 格式，使其更容易阅读和编辑。特别优化以确保导出的 Markdown 文件可以在 Typora 等 Markdown 编辑器中正确打开和显示。标准格式：以标准的

Flamingo: a Visual Language Model for Few-Shot Learning 简读

Flamingo 的灵感来源于此，旨在将这种能力扩展到视觉-语言任务中，使模型能够处理图像、视频和文本的混合输入，并在少样本条件下完成诸如视觉问答（visual question-answering）、图像描述（captioning）和分类等任务。然而，现有的视觉-语言模型（如基于对比学习的 CLIP）虽然在零样本（zero-shot）场景下表现不错，但只能输出图像和文本之间的相似度分数，无法生成

#语言模型 #人工智能 #自然语言处理

共 12 条

请选择