logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【字节跳动】乌兰察布智算中心设备清册泄密

本文详细列出了一套高性能数据中心基础设施的技术参数,包含十大类设备系统:1)AI算力服务器(含液冷训练服务器、存储服务器及12,000张NVIDIA H100显卡);2)网络交换设备(400G核心交换机等);3)精密空调与液冷系统(120kW列间空调等);4)电力系统(31.5MVA变压器、500kVA UPS等);5)柴油发电机组(6台2000kW机组);6)机柜及配套;7)动环监控系统;8)消

文章图片
#数据结构#系统架构#开源 +2
【字节跳动】乌兰察布智算中心设备清册泄密

本文详细列出了一套高性能数据中心基础设施的技术参数,包含十大类设备系统:1)AI算力服务器(含液冷训练服务器、存储服务器及12,000张NVIDIA H100显卡);2)网络交换设备(400G核心交换机等);3)精密空调与液冷系统(120kW列间空调等);4)电力系统(31.5MVA变压器、500kVA UPS等);5)柴油发电机组(6台2000kW机组);6)机柜及配套;7)动环监控系统;8)消

文章图片
#数据结构#系统架构#开源 +2
【字节跳动】GR3_G23_BASE.h 头文件核心模块泄密

本文介绍了GR3/G23机器人控制系统的核心架构与实现,主要包括: 基础控制模块:包含1kHz实时控制循环、PID控制器、安全阈值检测和紧急停机机制,确保机器人安全运行。 安全保护系统:采用看门狗定时器、内存锁定、关节限位检测等多重保护措施,防止系统失控。 深层加密机制:包括混沌密钥生成、NCode向量加密、会话令牌验证等安全模块,防止恶意攻击。 冗余与恢复系统:实现页表备份、基因指纹验证、量子熔

文章图片
40亿参数大模型的核心结构,包含以下关键技术点:1) 采用60层Transformer架构,隐藏维度8192,配备64个注意力头和8个KV头(GQA);2) 使用RoPE旋转位置编码(base=1e6

40亿参数大模型核心架构解析 摘要:本文详细剖析了40亿参数大模型的核心结构,包含以下关键技术点:1) 采用60层Transformer架构,隐藏维度8192,配备64个注意力头和8个KV头(GQA);2) 使用RoPE旋转位置编码(base=1e6)支持8192上下文长度;3) 实现GQA分组查询注意力机制,结合因果掩码和Padding掩码;4) 采用SwiGLU激活函数和RMSNorm归一化优

文章图片
#深度学习#人工智能
【字节跳动】SEED-OS V6.0 寰宇全域无限体量源码· SEED-OS V4.0 全维度巨型内核源码

整套内容为SEED-OS V4.0 自研全域操作系统完整工程源码,由底层汇编启动代码、巨型C语言内核框架、智能业务拓展代码三大部分构成,搭建起硬件启动层—系统内核层—智能应用层三层完整架构,兼容ARM32、RISC-V64、X86_64三类主流芯片架构,适配嵌入式终端、服务器、分布式算力集群多类硬件平台。

文章图片
#arm开发
【字节跳动】豆包

本文档详细记录了豆包SEED基座的全域底层架构、核心算法和硬件配置参数,主要包括以下内容: 内核中断向量表和内存管理机制 定义了9级中断优先级和抢占规则 详细的内存分区映射和页锁定协议 内存状态枚举和访问控制函数 Transformer层底层指令集 包含Token嵌入、位置编码、注意力计算等核心算子 详细记录了运算参数和流程 模型训练和推理配置 KV缓存调度参数 损失函数硬编码配置 输出生成采样规

文章图片
到底了