logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

论文导读:万卡集群训练大模型(by字节跳动)

字节跳动提出了万卡集群大模型训练架构MegaScale,并在12288个GPU上训练一个175B LLM模型时,用MegaScale实现了55.2%的MFU,比Megatron-LM提高了1.34倍;提供了万卡集群训练大模型的踩坑经验;证实了强大完备的训练基础设施(包含各种各样的诊断工具、监测工具、可视化工具等)对高效、稳定训练LLM至关重要;

文章图片
#人工智能#深度学习
Linux运维08:netstat命令详解

netstat是一个控制台命令,可用于监控本机的TCP/IP网络,获得路由表、网络连接以及所有网络接口设备的状态信息。一般情况下,我们主要使用netstat命令显示与IP、TCP、UDP和ICMP协议相关的统计数据,检验本机各端口的网络连接情况。...............

文章图片
Linux运维10:scp命令详解

scp是secure copy的简写,用于在Linux下进行远程拷贝文件的命令,和它类似的命令有cp,不过cp只是在本机进行拷贝不能跨服务器,而且scp传输是加密的。可能会稍微影响一下速度。

文章图片
Linux运维18:网络和监控

在网络运维中网络和监控命令类似于这些: ping, ip, arping,netstat等命令,用于查看 linux 服务器 ip 地址,管理服务器网络配置等。

文章图片
#linux#运维#网络
Linux运维21:服务器内存过高跟踪思路

Linux服务器内存使用量超过阈值,触发报警或者OOM。对于线上问题,要进行初步定为和分析,为后面的研发人员分析和解决问题,提供帮助。本文将将此类问题的排查的方法和思路分享给各位,希望对您有所帮助。......

文章图片
Linux运维04:vmstat命令详解

vmstat主要是用来检测虚拟内存的,可以展现给定时间间隔的服务器的状态值,包括CPU使用率,内存使用率,虚拟内存交换情况,IO读写情况等。

文章图片
Linux运维09:ip命令详解

Linux中的ip命令功能强大,可以完成接口配置、路由管理等任务。

文章图片
Linux运维12:history命令详解

history命令来自于英文单词历史,其功能是用于显示与管理历史命令记录。Linux系统默认会记录用户所执行过的所有命令,可以使用history命令查阅它们,也可以对其记录进行修改和删除操作。

文章图片
Linux运维22:应用或命令卡住问题跟踪方法

在Linux系统使用过程中,可能由于某种原因导致某个应用或者命令卡住,并处于D+状态。对于这种问题,要进行初步定为和分析,为后面的研发人员分析和解决问题,提供帮助。本文将将此类问题的排查的方法和思路分享给各位,希望对您有所帮助。......

文章图片
#大数据#java#数据库
HBM研究框架:突破“内存墙”,封装新突破

HBM突破“内存墙”,实现高带宽高容量,成为Al芯片最强辅助,我们认为HBM将持续迭代,1/0口数量以及单1/0口速率将逐渐提升,HBM3以及HBM3e逐渐成为Al服务器主流配置,且产品周期相对较长,单颗容量及配置颗数逐步增加,预计HBM4于2026年发布。2024年全球HBM市场有望超百亿美元,市场空间足,国产供应链加速配套。

文章图片
    共 130 条
  • 1
  • 2
  • 3
  • 13
  • 请选择