
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
极限性能优化:用PyTorch和ONNX实现模型推理加速
在终端性能压力下,如何利用PyTorch和ONNX技术优化深度学习模型的推理性能?从模型量化、图优化到跨框架部署,深入探讨如何将推理时间从500ms降至50ms,同时保持模型精度。
高并发压测第3小时:老炮JVM调优专家与应届生手撕红黑树的终极对决
在高并发压测的第3小时,系统性能告急,GC日志中频繁出现YoungGC告警。P8级别的老炮JVM调优专家与手撕红黑树卡壳的应届生展开了一场技术对决。老炮现场推导JMM模型,解释双重检测锁的原理,而应届生则试图用Arthas诊断生产问题,却意外发现了隐藏的内存泄漏。随着QPS从2000飙升至10万,两人在极限压力下共同寻找解决方案,最终在FullGC告警解除的瞬间,迎来了意外的转机。
到底了







