logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

注意力机制进化之路:MHA、MQA、GQA

本文将深入浅出地介绍几种主流的注意力机制,包括多头注意力 (MHA)、多查询注意力 (MQA)、分组查询注意力 (GQA),以及最新的 DeepSeek FlashMLA,帮助您理解它们的工作原理、优缺点以及应用场景。相比 MQA,GQA 通过分组,让模型拥有了更丰富的“知识库”,性能更接近 MHA,通常能达到 MHA 性能的 98%-99%。您可以将其理解为,模型将输入信息分解成多个方面,然后分

一文了解:大模型「推理基准测试」及其「核心评估指标」

需要注意的是,TPS 的计算是批量(batch)完成的,不是实时(live)动态变化的指标。(Sampling Parameters):不同的采样策略,比如:Greedy(每次选得分最高的 Token)、Top-p(按累积概率筛选)、Top-k(按最高 k 个概率选)、Temperature(调整随机性)都会影响生成速度。这意味着,最终统计的结果是基于一部分已经完成的代表性请求子集得出的,也就是说

DeepSeek刚刚发布了DeepSeek-OCR

这种对表、公式、几何的解析能力,已经彻底超越了传统的“识别”范畴,它真正踏入了“理解”的层次。在当前高质量数据日益稀缺的背景下,一个能“自产”数据的能力,其价值是无法估量的。随着模型和数据量的不断膨胀,对效率和成本的追求,只会让“光学压缩”这种高效的“数据打包”技术,变得越来越不可或缺。这部分的作用,就是对压缩后的“精炼信息”进行全局性的理解和推理,捕捉文档的整体结构和逻辑。首次用定量的分析和工程

#人工智能
Qwen3-Next-80B-A3B 深度技术解读

Gated DeltaNet 相比常用的滑动窗口注意力(Sliding Window Attention)和 Mamba2 有更强的上下文学习(in-context learning)能力,并在 3:1 的混合比例(即 75% 层使用 Gated DeltaNet,25% 层保留标准注意力)下能一致超过超越单一架构,实现性能与效率的双重优化。对于需要处理超长文档(几十万 token 级别)的产品或

#人工智能
【一文了解】Llama.cpp

它是一个高度模块化和可扩展的库,适合自然语言处理任务,涵盖从基础到高级的多种功能,满足不同场景需求,为我们搭建大模型应用提供了更为便利的工具。尽管它不支持训练,但在推理方面,它具备丰富的功能,支持模型加载、聊天、流式输出、上下文管理、量化、API 接口等,它是使用Meta系列模型一款不可缺少的工具。通过 `llama-server` 或社区项目,例如 `llama-cpp-python`,可以把

人脸识别开源库face_recognition

原文出处: https://blog.xugaoxiang.com/ai/face-recognition-cnn.html软硬件环境ubuntu 18.04 64bitGTX 1070Tianaconda with python 3.6face_recognition 1.2.3dlibopencvface_recognition简介face_recognition号称是世...

#人脸识别#python
Visual Studio 2019配置OpenCV开发环境

原文链接https://xugaoxiang.com/2019/12/10/visual-studio-2019-opencv/软硬件环境Visual Studio 2019OpenCV 4.1.2Windows 10视频看这里Visual Studio 2019到官方链接下载安装文件,安装完Visual studio 2019后,再选择安装相应组件,这里需要安装c++桌面应...

#opencv
说起Python的执行效率,我就 ...

软硬件环境windows 10 64bitpython 3.8numba 0.52.0前言Python是一门应用非常广泛的高级语言,但是,长久以来,Python的运行速度一直被人诟病,相比...

#python#编程语言#java
Python实现天文计算

迷途小书童读完需要2分钟速读仅需 1 分钟1 简介ephem 模块为 Python 提供了精确的天文计算能力,可以预测星球、卫星的轨道信息,计算日出日落、经星时间等数据,它的算法准确可靠。最初由 Brandon Craig Rhodes 在 20 世纪 90 年代开发,经过多年扩展补充,应用非常广泛。2 安装首先,确保您的系统上安装了 Python。您可以从 Python 的官方网站 ( ...

#python#开发语言
MS COCO数据集

简介MS COCO数据集是目标检测领域中另一个非常有名的大型数据集(前面介绍过 PASCAL VOC ),其中COCO是Common Objects in COntext的缩写,由微软公司...

#python#大数据#计算机视觉 +2
    共 60 条
  • 1
  • 2
  • 3
  • 6
  • 请选择