logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

梯度检查点的前世今生:深度学习显存优化技术的演进与未来趋势

本文深入探讨了梯度检查点(Gradient Checkpointing)技术在深度学习显存优化中的演进与应用。从2016年解决大模型训练显存不足的困境开始,梯度检查点通过牺牲部分计算时间换取显存空间的显著节省,使显存消耗从O(L)降低到O(√L)量级。文章详细介绍了该技术的三代演进、现代框架中的实现与优化,以及在实际项目中的最佳实践和未来趋势,为深度学习研究者提供了宝贵的参考。

#深度学习
从零构建Java数据脱敏引擎:设计模式与性能调优实战

本文详细介绍了如何从零构建高性能Java数据脱敏引擎,涵盖设计模式应用与性能调优实战。通过策略模式与工厂模式实现弹性架构,优化正则表达式性能瓶颈,解决内存碎片化问题,并针对手机号、身份证、银行卡等敏感数据提供高效脱敏方案。文章还分享了JMH基准测试、对象池化技术及生产环境部署建议,助力开发者打造金融级数据脱敏系统。

#性能优化#设计模式
ARM64与AARCH64区别:嵌入式开发者必读

本文深入解析ARM64与AArch64的区别,揭示嵌入式开发中因术语混淆导致的启动失败问题。从架构定义、工具链命名到实际启动流程,帮助开发者准确识别执行状态,避免常见陷阱。

ARM64与AARCH64区别:嵌入式开发者必读

本文深入解析ARM64与AArch64的区别,揭示嵌入式开发中因术语混淆导致的启动失败问题。从架构定义、工具链命名到实际启动流程,帮助开发者准确识别执行状态,避免常见陷阱。

到底了