logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

07-数据中心网络架构与运维:算力工厂的血管系统

高速化:从400G向800G、1.6T甚至更高带宽演进。(类比:工厂管道从窄变宽)智能化:引入AI和机器学习技术,实现网络的智能管理和优化。(类比:工厂的智能管道系统)软件化:SDN和网络自动化技术的广泛应用,实现网络的可编程性。(类比:工厂的软件定义管道)融合化:网络与计算、存储的深度融合,形成一体化的基础设施。(类比:工厂的集成管道系统)规划先行:在数据中心建设前,充分评估业务需求,合理规划网

#网络#架构#运维
04-网络安全基础:数字世界的防盗门与守卫

网络安全是指保护网络系统、设备和数据免受未授权访问、使用、披露、破坏、修改或干扰的技术和实践,就像保护我们的家园和财产安全一样。类比:网络安全就像一个城堡的防御系统,包括城墙、护城河、守卫、密码等,保护城堡内的居民和财宝。网络安全是数字世界的“防盗门”和“守卫”,它保护着我们的数字资产、隐私信息和在线活动。随着网络威胁的不断演变,网络安全也在不断发展,从传统的防火墙到现代的零信任架构,从人工分析到

#web安全#网络#安全
02-网络硬件设备详解:从大喇叭到算力工厂的进化

从共享到专用:从集线器的广播模式到交换机的点对点传输。从慢速到高速:从百兆以太网到400G/800G InfiniBand。从简单到智能:从传统网卡到DPU/智能网卡。从通用到专用:从通用交换机到AI专用IB交换机。理解这些网络设备的功能和应用场景,有助于我们设计和维护更高效、更可靠的网络系统。无论是搭建家庭网络、企业网络还是AI算力中心,选择合适的网络设备都是成功的关键。技术演进趋势智能化:网络

#网络
07-Data Lake 数据湖:包容万物的“数字海洋”

数据湖是企业数字化转型的战略水库。它打破了数据孤岛,让AI模型训练、实时欺诈检测和商业BI分析共享同一份数据源。我们拥有一个巨大的Data Lake(存储海量原始素材),治理良好(有清晰的Catalog)。当需要训练大模型时,通过筛选数据,利用极速管道,将燃料瞬间注入 GPU 集群,完成从数据到智能的升华。

#大数据
08-GPU与高性能计算监控:算力中心的核心监控

GPU监控是算力中心监控体系的核心组成部分,对于保障AI训练、科学计算等高性能计算任务的稳定运行至关重要。实时状态感知:实时掌握GPU设备的工作状态性能优化指导:为性能优化提供数据支持故障预警预防:提前发现潜在故障,减少业务中断资源规划依据:为容量规划提供数据基础成本控制支持:优化GPU资源使用,降低运营成本随着AI和HPC应用的不断发展,GPU监控的重要性将进一步提升。建立专业、全面的GPU监控

#GPU
00-算力中心监控体系总览:数字工厂的神经系统

算力中心监控体系是保障数字工厂稳定运行的"神经系统",它通过设备层、系统层、应用层和安全监控等多层次架构,实现对硬件、软件、业务和安全的全方位监测。核心组件包括数据采集、存储、分析、可视化和告警系统,采用主动/被动、粗/细粒度等多样化监控方式。未来发展趋势呈现智能化、云原生、一体化和实时化特征,涵盖AI异常检测、容器监控、统一平台和流处理等技术。本系列文档分为基础内容和运维提升

GPU (Graphic Processing Unit) 通俗原理解析:AI 时代的“算力发动机”

GPU是 AI 时代的发动机。CPU是管家,负责统筹。GPU是苦力,负责搬砖(算数)。显存是砖头堆场,越大越好。NVLink是快速通道,让苦力们能协同工作。

Alluxio 的商业价值与竞品对比

Alluxio的商业价值在于解决存算分离架构中的成本与效率矛盾。其核心优势包括:1)通过冷热分层降低存储成本,用廉价S3存储实现本地SSD性能;2)虚拟联合文件系统打破数据孤岛,实现零迁移成本的数据整合;3)缓存机制减少云API调用和流量费用。相比传统分布式存储如Ceph,Alluxio作为非侵入式的数据编排层,不持有数据且迁移成本为零,特别适合混合云和多云场景。在AI训练中,Alluxio能有效

#缓存
不能更改网络为桥接:已没有未桥接的主机

vmware 不能更改网络为桥接:已没有未桥接的主机网络适配器,相信很多使用VMware虚拟机的朋友都遇到过这个问题。

Intel VT-x enabled 却无法打开64位虚拟机

情景:机型:联想 T430前些天运行64位虚拟机没有问题,今天打开却跳出无法执行64位操作,很是诧异。便根据提示进行检查,半小时无果。解决方案:突然想起来以前每次打开VMware虚拟机时,总是蹦出一个绿色框,上面提示临时关闭核晶引擎。终于找到了原因,前几天将360安全卫士取消了开机自启动。可是它的“核晶防护引擎”却开机自启动。(该引擎基于CPU硬件虚拟化技术,是为64位Win

    共 14 条
  • 1
  • 2
  • 请选择