shilei-luc 个人主页

@weixin_38151747

shilei-luc

2024-11-12 08:46:55 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

解读《华为鲲鹏920 TSV110微架构评测（上）:初露锋芒，砥砺前行》

近年来，纵使摩尔定律已死的论调甚嚣尘上，处理器性能还是迎来了一波爆发式增长；适逢DSA的黄金时代，巨头们对于自研微架构的热情空前高涨。众多因素加持下，处理器新秀们如雨后春笋般层出不穷。华为作为世界舞台的顶级玩家之一自然不会错过这场盛宴。在海思麒麟的光芒下鲲鹏系列并不为多数人所知，但它的故事早在2016年就由鲲鹏916拉开了序幕。时至2019年，第一颗7nm数据中心ARM处理器鲲鹏920翩然而至，将

#华为 #架构

解读《华为鲲鹏920 TSV110微架构评测（下）:初露锋芒，砥砺前行》

想要如苹果一样在4周期的访存延迟上更进一步，不仅仅需要强大的逻辑设计能力（从苹果的专利来看，其中有很多细节）还需要强悍的物理设计能力，这样的投入是否有足够的性价比各设计公司都会有自己的考量。当load指令命中STQ中还未来得及写回DCache的store指令（访问了相同的物理地址）时，配备了store-to-load forwarding的处理器无需等待store指令写回DCache后再执行loa

#架构 #华为

在机遇与挑战之间：鸿蒙生态的开发者之路

在鸿蒙生态的建设中，每一个挑战都是一次成长的机会。比如，开发者可以设计一款可以在手机上操作、在平板上展示、在智能电视上播放的多平台应用，这种多样性为开发者提供了丰富的创作空间。项目开始时，我面临技术学习和工具使用的双重挑战，但通过与团队的合作和互相学习，我们最终克服了困难，实现了预期的功能。在这个平台上，开发者不仅可以分享自己的应用和经验，还可以与其他开发者合作，整合彼此的技术与资源。通过鸿蒙的分

#harmonyos

基于性能分析引导的优化（Profile Guided Optimization, PGO)

现代程序优化不仅仅依赖编译器的静态优化，还需要结合运行时性能数据，以实现更深层次的优化。基于性能分析引导的优化（Profile Guided Optimization, PGO）是一种先进的优化技术，利用程序的实际运行数据，指导编译器对代码的布局、路径选择和指令生成进行调整，从而显著提升性能。PGO 是一种利用运行时行为数据进行编译优化的技术，特别适用于性能关键型应用。PGO 的核心是通过两阶段编

#运维

Node.js能跟上AI的浪潮吗？

Python之所以成为AI开发的主流语言，不仅因为其语法简洁、易于上手，更是因为它有丰富的AI库与框架（如TensorFlow和PyTorch）支持底层的数学运算和硬件加速，这些框架为AI模型的训练与推理提供了高效的计算能力。在许多实际的AI项目中，Node.js仍然拥有其独特的地位。AI技术在继续发展的同时，也在走向服务化、轻量化，而Node.js可以很好地适应这种趋势——它可以帮助开发者搭建轻

#node.js #人工智能

动态库与 GDB：如何调试共享库（.so 文件）

然而，调试动态库往往复杂，因为它们在运行时动态加载，函数符号可能未绑定，甚至部分库可能被延迟加载。动态库的调试就像乐队排练：主程序是指挥，动态库是乐器。调试动态库不仅仅是找到符号和设置断点的过程，更是深入理解程序运行时动态链接的一个机会。调试动态库，就像解开复杂的拼图——你需要找到正确的碎片，理清它们的连接关系。为了模拟调试动态库的场景，我们创建一个简单的共享库和一个调用它的主程序。动态库的符号在

#后端

鲲鹏920与x64架构在大数据分析中的应用差异及优化建议

x64架构同样提供了高效的内存访问策略，特别是利用其多级缓存（L1、L2、L3）和更高带宽的内存系统，能够实现快速的内存读写。鲲鹏920的设计中，支持更高效的内存管理，可以通过控制缓存一致性来避免多核并发时的冲突。鲲鹏920支持通过其硬件特性和ARM架构的支持来进行高效的分布式计算，尤其在处理大规模数据集时，能够通过高效的内存管理和并行计算任务来提高分布式系统的性能。：将在深度学习优化、GPU加速

#arm

到底了