Shilong Wang 个人主页

@Winsleo

Shilong Wang

2024-01-19 16:32:02 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

多模态视频理解领域 Benchmark 与 Leaderboard 整理

本文系统梳理了多模态视频理解领域的核心基准测试（Benchmark）和排行榜（Leaderboard），为研究者提供评估模型性能的参考框架。重点介绍了7个具有代表性的Benchmark，包括MMBench-Video、Video-MMMU等，涵盖通用视频理解、教育知识获取、3D空间推理等多样化任务。同时整理了4个主要Leaderboard，如OpenCompass司南榜单和SuperCLUE中文评

#算法 #人工智能 #计算机视觉 +1

Matrix Trace

ATLet Aaij∈Fn×n, where FAi1∑naiin×n→F.trATtrA. Since (ATiiaiiATi1∑naiitrA□trABtrAtrB.trABi1∑naiibiii1∑naiii1∑nbiitrAtrB□trλAλtrAλ∈F.trλAi。

#人工智能 #机器学习 #算法 +2

多模态视频理解领域 Benchmark 与 Leaderboard 整理

#算法 #人工智能 #计算机视觉 +1

大模型基础：Foundamentals of LLM

摘要：自回归生成模型（如GPT）通过逐步预测序列元素（文字、像素等）实现内容生成，核心是Transformer解码器的掩码自注意力机制。其优势在于生成连贯性强，但受限于逐词生成的顺序性。为提升效率，LLM引入past_key_values缓存历史注意力计算结果（key/value），将计算复杂度从O(n²)降至O(n)。该技术与扩散模型形成互补（离散vs连续数据生成），共同推动生成式AI发展。

#机器学习 #人工智能 #算法 +2

SLAM基础：旋转向量与四元数

旋转的表示：旋转向量与四元数

#线性代数 #矩阵

到底了