logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 2: DDP Training Implement

斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 2: DDP Training Implement

文章图片
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 2: DDP Training

斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 2: DDP Training

文章图片
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 1: Training Loop Implement

斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 1: Training Loop Implement

文章图片
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 1: Training Loop

斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 1: Training Loop

文章图片
DeepSeek MLA(Multi-Head Latent Attention)算法浅析

DeepSeek MLA(Multi-Head Latent Attention)算法浅析

文章图片
#DeepSeek
GGML源码逐行调试(中)

GGML源码逐行调试(中)

文章图片
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 15: Alignment - SFT/RLHF

斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 15: Alignment - SFT/RLHF

文章图片
GGML源码逐行调试(下)

GGML源码逐行调试(下)

文章图片
MCP 与 Function Calling 的关系

MCP 与 Function Calling 的关系

文章图片
#MCP
SSH和VScode远程开发

使用SSH远程连接和VScode远程开发提高程序开发效率

#ssh#vscode
    共 105 条
  • 1
  • 2
  • 3
  • 11
  • 请选择