logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

北京邮电大学人工智能专业考研复试笔记——第二部分

组件作用类比卷积层提取局部特征放大镜找细节激活函数引入非线性判断有没有池化层降维、扩大视野站远看整体堆叠深层层层抽象从线条到物体全连接层综合决策法官判案机制显存占用推理速度模型智商工业界地位MHA极高(8份KV)慢最高早期使用,现已淘汰MQA极低(1份KV)极快较低极端速度场景GQA低(2-4份KV)快接近MHA当前绝对主流面试高分话术“GQA 本质上是对 KV Cache 显存瓶颈的优雅妥协。

#人工智能#机器学习#深度学习 +1
01背包和完全背包(可能是最易懂最详细的)

与01背包几乎相同,但是物品的数量是无限的。

#算法#动态规划
到底了