logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Cartographer SLAM 系统架构与算法框架(1)

单个机器人的完整运动历史,由时序排列的Nodes组成。// 轨迹唯一标识 (支持多机器人)// 时间戳// IMU 重力对齐// 滤波后点云// 局部坐标系位姿支持多轨迹并行 (Multi-robot SLAM)每个 Node 存储压缩后的点云数据 (用于闭环验证)Cartographer 的架构设计体现了分层解耦前端: 保证实时性和局部精度 (Scan-to-Submap)后端: 保证全局一致性

#算法#unity#游戏引擎
RK3576平台OpenCL GPU编程实战指南

本专栏《RK3576平台OpenCL GPU编程实战指南》专注于在Rockchip RK3576(ARM+Mali GPU)平台上进行OpenCL 2.0开发。课程包含20节系统化教程,从基础环境搭建、OpenCL编程模型到Mali GPU架构解析,重点讲解内存优化、并行算法实现及实战应用。特色包括针对Mali-G52的零拷贝优化、图像处理/AI推理加速案例,以及与CUDA的差异化对比。通过C++

#人工智能#计算机视觉#深度学习
Python CUDA实战:向量加法的三种实现与性能优化完全指南 (4)

Python CUDA向量加法性能优化指南 本文详细介绍了三种GPU向量加法实现方式及其性能优化策略: Naive基础版本:最简单的实现方式,但受限于GPU线程数,且数据传输成为主要瓶颈(测试显示数据传输占95.7%时间) Grid-Stride Loop优化:通过让每个线程处理多个元素,解决了大数组处理问题,性能提升随数组增大而显著(100M元素时提升24.3%) Pinned Memory加速

文章图片
#python#开发语言
到底了