logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

边缘计算实战:在OpenEuler 25.09上构建轻量级边缘节点

ps aux | grep "temperature_sensor.py" | grep -v grep | awk '{print "内存: " $6/1024 " MB, CPU: " $3 "%"}'ps aux | grep "edge_api.py" | grep -v grep | awk '{print "内存: " $6/1024 " MB, CPU: " $3 "%"}'本文将通

#架构
在CANN上跑个模型到底多简单?三段代码搞定工业缺陷检测

本文分享了在openEuler操作系统上使用华为CANN框架进行昇腾NPU开发的实战经验。文章展示了一个PCB缺陷检测项目从Ubuntu+GPU迁移到openEuler+NPU的全过程,仅用三段核心代码就实现了显著性能提升:环境配置脚本、NPU混合精度训练代码和优化推理代码。最终在昇腾310上实现1.84ms的推理速度,比原GPU方案快12倍,比CPU快7.4倍。文章详细介绍了openEuler上

文章图片
#服务器#机器学习#运维 +2
在CANN上跑个模型到底多简单?三段代码搞定工业缺陷检测

本文分享了在openEuler操作系统上使用华为CANN框架进行昇腾NPU开发的实战经验。文章展示了一个PCB缺陷检测项目从Ubuntu+GPU迁移到openEuler+NPU的全过程,仅用三段核心代码就实现了显著性能提升:环境配置脚本、NPU混合精度训练代码和优化推理代码。最终在昇腾310上实现1.84ms的推理速度,比原GPU方案快12倍,比CPU快7.4倍。文章详细介绍了openEuler上

文章图片
#服务器#机器学习#运维 +2
在CANN上跑个模型到底多简单?三段代码搞定工业缺陷检测

本文分享了在openEuler操作系统上使用华为CANN框架进行昇腾NPU开发的实战经验。文章展示了一个PCB缺陷检测项目从Ubuntu+GPU迁移到openEuler+NPU的全过程,仅用三段核心代码就实现了显著性能提升:环境配置脚本、NPU混合精度训练代码和优化推理代码。最终在昇腾310上实现1.84ms的推理速度,比原GPU方案快12倍,比CPU快7.4倍。文章详细介绍了openEuler上

文章图片
#服务器#机器学习#运维 +2
【算法合集】学习算法第一天(链表篇)

众所周知算法是比较复杂又基础的学科,每个学编程的人都会学习大量的算法。无论在我们面试还是笔试算法是必不可少的

文章图片
#java#算法#学习 +1
异腾910B NPU实战:vLLM模型性能优化深度指南

本文探讨了在异腾910B NPU环境下优化vLLM性能的多维度策略。首先介绍了标准化测试环境的搭建方法,包括资源监控脚本的创建。随后详细解析了vLLM启动参数调优技巧,如内存利用率设置和批处理参数调整。文章还涵盖了模型量化方案(8-bit和4-bit)的实施与效果验证,以及动态批处理优化策略。通过参数调优、量化技术和批处理优化相结合,实现了延迟降低15-25%、吞吐量提升40-60%的显著效果。最

#性能优化
轻量级云原生体验:在OpenEuler 25.09上快速部署单节点K3s

本文介绍了在OpenEuler 25.09系统中快速搭建云原生环境的方法。通过VMware虚拟机配置2核CPU、4GB内存的基础环境,使用国内镜像源一键安装轻量级Kubernetes发行版K3s,仅需1分钟即可完成部署。文章详细演示了部署Nginx应用的完整流程,包括创建部署文件、应用配置和访问验证,并展示了资源监控方法。实践表明,该方案具有安装简单、资源占用低(总内存约1GB)、功能完整等优势,

#人工智能#机器学习#科技 +2
扫描全能王引领AI时代,助您轻松实现文档数字化!

近期,扫描全能王“智能高清滤镜”正式上线。使用过程中,只需点击拍摄按钮,便可得到一张如原稿打印般清晰、平整的图片。相比传统的扫描软件,用户使用“智能高清滤镜”时无需思考拍摄角度、光源、背景,该功能可智能检测图像中存在的问题,自动判定图像优化方式,实现模糊、阴暗、手指等干扰因素全处理,一键应对生活、生产中90%的扫描难题。

文章图片
#人工智能#python
从MVC 到DDD 架构

最近在做一个项目,使用的是DDD架构思,觉得很不错,在此记录下。

文章图片
#架构#mvc#ddd
CANN特性深度解析:从入门到精通的自定义算子开发指南

本文分享了作者从CUDA转向CANN开发过程中的经验教训。文章首先介绍了CANN的三层架构设计,强调其不仅是AI推理框架,更是一套完整的异构计算解决方案。接着详细讲解了基于openEuler的环境搭建步骤和验证方法,包括必要的环境变量设置和工具链检查。然后通过ACL接口实战演示了NPU设备管理、流管理和内存管理等核心概念,并提供了性能优化技巧。最后重点介绍了自定义算子开发流程,包括Python接口

文章图片
#unity#游戏引擎#架构 +2
    共 77 条
  • 1
  • 2
  • 3
  • 8
  • 请选择