frostmelody 个人主页

@Listennnn

frostmelody

2022-11-24 21:44:41 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

NLP语言模型训练里的特殊向量

在第 ( t ) 个时间步，只能看到 ( y_1, y_2, \ldots, y_{t-1} ) 这些前面的 token，不能看到未来的信息。，但它们出现在不同类型的 NLP 模型中，并承担不同的功能。在 Transformer 类模型中，DEC token 也。用于文本生成、机器翻译、问答任务（如 GPT、T5）。依赖“过去的输出”来预测下一个词，典型的自回归结构。，但它们的使用方式略有不同，取

#自然语言处理 #语言模型 #人工智能

π0流匹配模型-VLA

在数学和物理中，“流”描述了一个点随着时间连续运动所划出的轨迹。在流匹配中，我们把一个数据点（比如，一个代表动作的向量）想象成空间中的一个点。这个点会随着一个虚构的“时间”参数t从 0 流向 1。t=0时，这个点是简单的噪声。t=1时，这个点变成了我们想要的干净数据（正确的动作）。中间的所有状态x_t就构成了这个数据点从噪声“流动”成干净数据的一条连续轨迹。整个数据集的这种“流动”所形成的轨迹场，

#人工智能

π0流匹配模型-VLA

#人工智能

纯视觉方案还无法完全替代激光雷达（LiDAR）

摄像头是队里的“观察员”：眼神好（光线好时），能详细描述看到的物体（颜色、形状、路牌文字），但天黑、下雨、起雾就看不清楚，尤其不擅长准确判断远距离物体到底离多远。激光雷达是队里的“测绘员”：不管白天黑夜，都能拿出一把超快的激光尺，精准测量周围每个点的距离，画出精确的3D地图。但他对颜色、文字不敏感，也看不清物体表面的细节纹理。毫米波雷达是队里的“预警员”：能在恶劣天气下探测到大致的物体和速度，但看

#人工智能

视觉语言导航与目标导航

目标导航（Object Navigation）是VLN的进阶任务，要求机器人在陌生3D环境中，基于目标描述（如坐标、图片或自然语言）自主探索并规划路径，无需显式逐步指令。VLN（Visual-Language Navigation）是一种指令跟随任务，要求机器人根据自然语言指令（如“去客厅拿遥控器”）在未知环境中执行导航。：累积历史观测信息，辅助决策。：导航技术被视为具身智能（embodied A

#人工智能

为什么当前的大型语言模型（LLMs）普遍采用“仅解码器”（Decoder-only）架构？

仅解码器架构在大型语言模型（LLM）领域占据主导地位，主要因其与文本生成任务的高度契合。该架构通过单向注意力机制（Causal Self-Attention）逐个生成词元，确保生成过程符合文本的自然顺序。KV缓存技术进一步优化了推理效率，减少了重复计算。仅解码器架构的简洁性和统一性使其在训练效率和可扩展性上表现优异，能够通过“下一个词元预测”任务有效利用海量数据进行自监督学习。此外，单向注意力机制

#语言模型 #架构 #人工智能

让视觉基础模型（VFMs）像大语言模型（LLMs）一样“会思考”

视觉提示是一种“以例示教（learning by example）”的交互模式。用户不是用文字描述，而是直接在图像上提供一个视觉示例，让模型去理解这个示例背后的概念，并在其他地方或图片中找到相似的实例。这个示例可以是一个物体的截图，或是一个精确的边界框。DINO-R1 不仅仅是一个性能更好的检测模型。从传统的"模仿标准答案"（SFT），转变为"在内部竞争中追求卓越"（最大化相对优势 RA），同时不

#语言模型 #人工智能 #自然语言处理

云计算产业链

本质特征按需服务模式：以网络化方式提供可配置的计算资源共享池（网络/服务器/存储/应用）。核心能力：快速弹性扩容、资源池化共享、按使用量付费、低管理开销。技术原理：通过分布式计算将大型程序拆解为小程序并行处理，实现高效海量数据处理。部署模式分类类型适用场景代表案例公有云中小企业标准化服务阿里云/腾讯云私有云政府/金融等高安全需求领域政务专有云混合云兼顾灵活性与数据主权企业核心数据私有+边缘公有服务

#云计算

生成对抗网络（GAN）详解（代码实现）

通过这个例子，可以看到 GANs 的具体实现其实是将生成器和判别器的对抗思想转化为代码。生成器从噪声生成图像，判别器判断真假，两者交替训练，最终生成器能生成逼真的手写数字。如果运行这段代码，经过足够多的轮次（比如 100 轮），会发现生成的图像越来越接近真实的 MNIST 数字。附：论文中提到了马尔可夫链（Markov Chain）和近似推理网络（Unrolled Approximate Infe

#生成对抗网络 #人工智能 #神经网络

MLLM常见概念通俗解析（五）

该论文介绍了一种在“零样本指代表达式理解”（Zero-shot Referring Expression Comprehension, REC）任务中取得顶尖性能的解决方案。“指代表达式理解”任务的目标是根据一段文字描述，在图像中定位到特定的目标物体。而“零样本”设置则要求模型在没有任何针对性训练的情况下，直接利用预训练好的知识完成任务。该研究团队通过一种创新的方法，结合了。

#人工智能

共 88 条

请选择