
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
简洁版:从物理圆周推导欧拉公式
网上常见的泰勒展开、构造函数求导证明,要么抽象难懂,要么存在循环论证。本文从复数自带的旋转几何意义、匀速圆周运动切入,全程只用基础代数、实数微积分,一步步推导出欧拉公式。懂复平面的人建议直接从第三节开始看。任意复数写作zxiyz = x + iyzxiyxxx:实部,对应平面直角坐标系横轴;yyy:虚部,对应平面直角坐标系纵轴;复数zzz等价于平面向量vxyvxy。

KV Cache和分组多头注意力GQA
大模型生成文本时,为什么越往后速度越快?长上下文场景下,显存是如何被吃掉的?KV Cache 和 GQA 是解决这些问题的关键机制。本文将用最直观的方式拆解这两个概念,帮助你在技术面试和实际应用中游刃有余。此文章意在总结视频的文字和结论,补充知识点,欢迎大家关注我的这个公众号和 up 的视频!KV Cache(Key Value Cache)是大型语言模型在推理阶段为加速生成速度而引入的核心机制。

到底了







