北京地铁1号线个人主页

@qq_54708219

北京地铁1号线

2023-03-09 17:33:31 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习中的Embedding（嵌入）层

Embedding（嵌入）层深度解析

#深度学习 #人工智能 #机器学习

深度学习笔试选择题：题组1

实际上，BatchNorm更适合固定尺寸的图像数据（因为批次统计要求固定尺寸），而LayerNorm更适合处理变长序列（如文本数据），因为它对每个样本独立归一化，不受序列长度变化影响。LayerNorm在训练和推理时都使用当前样本的统计量，行为一致。BatchNorm的归一化依赖于整个批次数据的统计（均值和方差），而LayerNorm的归一化仅依赖于单个样本自身的统计，不依赖批次大小。多任务学习能

#深度学习 #人工智能

华为深度学习面试手撕题：手写nn.Conv2d()函数

只允许利用numpy包，实现Pytorch二维卷积函数nn.Conv2d()

#深度学习 #面试 #人工智能

快手面试题：智能体的工具和技能区分

MCP（Model Context Protocol，模型上下文协议）Tools是在MCP协议框架下，由MCP服务器暴露给智能体（或客户端）的可调用功能。MCP是一个开放协议，它就像AI应用的“USB-C接口”，旨在标准化应用程序（如智能体、IDE）如何向大语言模型提供上下文和功能。在这个协议下，一个“Tool”就是一个可以被模型智能体调用的具体操作。Skills（技能）是一个更宽泛、更上层的概念

#MCP

快手面试题：如何扩展大模型的上下文长度？

扩展大模型上下文长度需要多管齐下：位置编码改进（如ALiBi、RoPE+插值）解决外推问题。注意力优化（稀疏、滑动窗口、聚类）降低计算开销。记忆与检索机制突破固定长度限制。训练策略（长数据微调、渐进式学习）增强模型适应能力。目前，通过位置插值和稀疏注意力微调，开源社区已能将数十亿参数的模型扩展到百万级token。随着研究和工程的不断进步，未来模型将能够更高效、更准确地处理任意长度的上下文，为复杂应

#人工智能

大模型三种主流架构对比：Causal LM（因果解码器架构）、Prefix LM（前缀解码器架构）和 Encoder-Decoder（编码器-解码器架构）

特性Causal LMPrefix LM代表模型GPT， LLaMAGLM， UniLMT5， BART输入侧注意力单向双向（前缀部分）双向（编码器）输出侧注意力单向单向（生成部分）单向（解码器）计算效率高（生成快）中低（生成慢）理解能力较弱（只看左边）中（看前缀两边）强（看输入两边）生成能力强强强最佳适用场景自由续写， Chat，代码生成文本填空，混合任务翻译，摘要，严格的数据转换如果你

#架构

7.2 状态价值函数 (State Value) 与动作价值函数 (Action Value) 详解

在马尔可夫决策过程框架下，假设智能体遵循一个策略（给定状态 s，选择动作 a 的概率）。从某个时刻 t 开始，智能体获得的回报定义为未来折扣奖励的总和：其中是折扣因子。特性状态价值函数动作价值函数定义从状态 s 开始，遵循策略的期望回报在状态 s 执行动作 a，然后遵循策略的期望回报输入状态 s状态 s 和动作 a输出一个标量一个标量如何用于决策无法直接比较动作，需要知道转移概率和策略可以直接比较

#人工智能 #算法 #机器学习

机器翻译指标：BLEU

BLEU 是一个在机器翻译领域极其重要的自动化评估指标。它通过计算机器译文与参考译文在 n-gram 上的修正精确度，并结合简洁惩罚，提供了一个快速、客观、低成本的质量评估手段，特别适用于系统级（语料库级别）的比较和迭代开发。

#机器翻译 #人工智能 #自然语言处理

7.1 强化学习（Reinforcement learning，RL）概述

强化学习是一门关于决策的科学。它让智能体通过与环境的交互，利用获得的奖励信号作为反馈，学习到一套能够最大化长期收益的行为策略。从经典的 Q-Learning 到引领潮流的 PPO，从基于价值的 DQN 到结合了感知与决策的深度强化学习，这一技术正在不断推动着人工智能向更接近人类智慧的方向发展。尽管仍面临探索、稀疏奖励、样本效率等挑战，但它在游戏、机器人、自动驾驶等领域的巨大成功，预示着其未来广阔的

#人工智能

7.1 强化学习（Reinforcement learning，RL）概述

#人工智能

共 63 条

请选择