m0_37755875 个人主页

@m0_37755875

m0_37755875

2024-04-08 15:24:08 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

再讲解Transformer，一文读懂架构精讲：从“我爱AI”到“I love AI”

本文详细解析了Transformer模型在机器翻译中的工作原理。模型由编码器和解码器组成：编码器通过自注意力机制理解输入文本（如中文"我爱AI"），解码器逐步生成目标语言（如英文"I love AI"）。重点讲解了多头注意力机制如何拆分语义信息，以及训练与推理时的关键差异。文章通过具体数值示例展示了词嵌入、位置编码、注意力权重计算等核心过程，并总结了Tran

#人工智能 #transformer #深度学习

大模型基石——Transformer介绍

例如，在句子“The cat sat on the mat”中，当你看到单词“sat”时，你的注意力可能会集中在“cat”和“mat”上，因为它们与“sat”有直接的语义关系。注意力机制的核心思想是：模型在处理序列中的某个元素时，可以“关注”序列中的其他元素，而不需要严格按照顺序处理。注意力机制的作用就是让模型在处理某个单词时，能够“关注”句子中的其他单词，从而捕捉上下文信息。在Transform

#transformer #深度学习 #人工智能

虚拟机双网卡搭建

项目描述：我们将探讨如何通过虚拟机中集群化部署的 centos系统来控制海康摄像机，并利用 OpenCV 实现基础的视频流处理。整个过程的实现，主要参考了海康的 API 文档，目标是通过虚拟机有效控制监控设备并进行视频数据的处理。博文描述：博文还将介绍如何在虚拟机中配置双网络环境，使得系统同时能够访问内网和公网。这一技术方案对于其他类似项目也具有很高的借鉴意义，特别是在需要同时进行公网和内网资源访

#linux #运维 #k8s +2

Ubuntu Docker 安装与远程连接笔记

在VSCode中配置Remote-SSH插件，填写相应的服务器IP、端口等信息，即可实现远程开发环境。在Ubuntu系统中，可能已经预装了低版本的Docker。首先需要卸载这些旧版本以避免冲突。，尽管实际上你的zlib版本高于1.2.3。完成上述步骤后，再次尝试拉取镜像应能正常工作。工具存在bug导致的。当尝试拉取镜像时可能会遇到错误提示。注：更改后需要重新登录才能生效。下载并编译最新版本的。

大模型基础问题扫描盲式复习

大模型面试知识全覆盖 sformer核心机制。Self-attention通过$Q$（查询意图）、$K$（索引属性）、$V$（承载信息）矩阵实现序列内部软寻址。$QK^T$除以$\sqrt{d_k}$稳定方差，防止梯度消失。主流LLM采用Decoder-only架构，因其训练（下一个词预测）与推理生成一致，且支持KV Cache提升效率。LayerNorm放置顺序影响训练：Pre-norm（先归一

#面试 #人工智能

相机几何：从三维世界到二维图像的映射

本文将带领读者开启一场独特的三维视觉工程之旅。我们不再止步于教科书式的公式推导，而是聚焦于如何将抽象的数学原理转化为可落地的工程实践。通过解剖相机的光学特性、构建成像数学模型、解析坐标系转换链条，直至亲手实现参数标定代码，我们将层层剥开三维视觉系统的核心构造。在这场旅程中，您将理解为何简单的针孔模型能衍生出自动驾驶的感知算法，掌握透镜畸变参数如何影响AR眼镜的虚实配准精度，洞悉坐标系转换矩阵怎样支

#计算机视觉 #3d #图像处理 +1

Python手把手搭建基于Deepseek大模型的本地知识库

在前面的文章，我介绍了基于LM studio的大模型部署和API调用，本文将介绍一个实际的项目案例，即利用Python构建一个本地化的知识库来加深大家对于大模型本地化应用的理解。构建基于Python的大模型本地知识库成为提升信息检索效率和保障数据隐私的关键手段。对于企业和个人用户而言，这不仅能加速日常工作的信息查找过程，支持更明智的决策制定，同时也提供了一个深入学习最新自然语言处理技术的机会。

#python #开发语言 #RAG

零基础本地部署DEEPSEEK大模型教程（LM Studio版）

上面两部主要是看CUDA是否成功加载，不然是CPU跑可能就很慢，一般来说都没有问题，有问题可能需要安装CUDA的库。在框中输入刚才搜的模型，因为你搜的模型会告诉你这个模型是否符合你的电脑配置，注：DEEPSEEK R1的GGUF量化版（如Q4_K_M）约需8GB显存。国内网盘镜像（含DEEPSEEK R1各量化版本）：暂未上传。：消费级显卡即可运行（实测NVIDIA 4060s流畅运行）（使用V

#语言模型 #人工智能 #深度学习

MCP Python技术实践

如果你经常与AI应用打交道，你可能会遇到这样的困扰：想让AI助手访问你的本地文件、连接数据库、或者调用某个API，但每次都需要复杂的配置和集成工作。而且，不同的AI应用有不同的集成方式，维护起来十分麻烦。Model Context Protocol（MCP）就是为了解决这个问题而诞生的。简单来说，MCP是一个标准化的协议，它就像是AI应用和外部数据源之间的"通用接口"。想象一下，如果所有的电子设备

#python #人工智能 #MCP

共 37 条

请选择