logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【论文笔记】SAM 2——革新视频与图像分割的交互式基础模型

SAM 2是一个能够处理图像和视频的统一模型,通过提示驱动的分割任务和流式记忆机制,在视频分割中减少交互次数并提高准确性,同时在图像分割中显著提升速度和精度。

文章图片
#论文阅读#计算机视觉#机器学习 +3
【DeepSeek开源周】Day 1:FlashMLA 学习笔记

FlashMLA是DeepSeek专为H架构的GPU设计的的高效MLA解码内核,优化了可变长度序列的多头潜在注意力机制。官方开源代码链接:https://github.com/deepseek-ai/FlashMLA

文章图片
#开源#学习#自然语言处理 +3
【论文笔记】Omni-Scene——以自我为中心稀疏视图场景重建的全高斯表征

Omni-Scene: 采用 Omni-Gaussian 表示法,通过结合基于像素和基于体积高斯表示的优势,实现了以自我中心的稀疏视图场景下高保真的三维重建,并支持多模态三维场景生成。

文章图片
#论文阅读#计算机视觉#自动驾驶 +3
【DeepSeek开源周】Day 1:FlashMLA 学习笔记

FlashMLA是DeepSeek专为H架构的GPU设计的的高效MLA解码内核,优化了可变长度序列的多头潜在注意力机制。官方开源代码链接:https://github.com/deepseek-ai/FlashMLA

文章图片
#开源#学习#自然语言处理 +3
【DeepSeek开源周】Day 3:DeepGEMM 学习笔记

DeepGEMM 是一个专为 NVIDIA Hopper 架构设计的高效 FP8 矩阵乘法库,支持普通和混合专家模型(MoE)分组矩阵乘法,通过简洁的实现和即时编译技术,实现了高性能和易用性。官方开源代码链接:https://github.com/deepseek-ai/DeepGEMM

文章图片
#学习#矩阵#云计算 +2
到底了