
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
大模型面试手撕代码指南
本文介绍了一个大模型面试手撕代码的GitHub项目,包含Attention机制、强化学习方法和常用工具的实现。目前已实现Self-Attention、Multi-Head Attention、RoPE等核心Attention模块,以及LoRA、LayerNorm等基础组件。项目代码经过GPT优化,仅展示基本逻辑,后续将补充文字讲解。链接:https://github.com/Ashside/LLM
到底了







