weixin_30415113 个人主页

@weixin_30415113

weixin_30415113

2023-09-05 11:32:50 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

vLLM生产环境实战：如何用Tensor Parallel让Qwen-32B模型吞吐量翻倍？

本文详细介绍了如何利用Tensor Parallel技术在vLLM生产环境中显著提升Qwen-32B模型的吞吐量。通过张量并行计算和优化通信策略，实现在4卡A100服务器上吞吐量提升200%至45 TPS。文章还提供了Docker部署模板、硬件配置建议和性能调优关键参数，帮助开发者高效部署和优化大语言模型推理。

3分钟搞懂矩阵自由度：从旋转矩阵到本质矩阵的实战解析

本文深入解析了矩阵自由度（DOF）的概念及其在计算机视觉和机器人SLAM中的应用。通过旋转矩阵和本质矩阵的实例，详细介绍了如何计算和理解矩阵的自由度，并探讨了其在参数优化、算法性能评估和几何解释中的实际价值。

#矩阵 #计算机视觉

大数据技术之Stome 概念

Storm 是一个分布式的，容错的实时计算系统Storm 实时低延迟，主要有两个原因：1 storm 进程是常驻内存的，没有hadoop 里面的不断的起停2 storm 的数据是不经过磁盘的，都是在内存里面的，处理完成就没有了，数据的交换经过网络，没有磁盘IOStorm 和hadoop的区别：数据来源不同，hadoop是hdfs 上某个文...

#大数据 #ui #运维

Ollama vs vLLM vs Xinference：三大本地大模型框架保姆级安装指南（含避坑技巧）

本文详细对比了Ollama、vLLM和Xinference三大本地大模型框架的安装与配置方法，提供保姆级指南和避坑技巧。Ollama以极简体验著称，vLLM专注高性能推理，Xinference支持多模态管理。文章涵盖全平台安装步骤、典型问题排查和性能调优方案，帮助开发者高效部署开源大模型。

Python实战：用昇腾ACL从零搭建ResNet50图像分类器（附完整代码）

本文详细介绍了如何使用昇腾ACL从零搭建ResNet50图像分类器，涵盖环境准备、模型加载、数据预处理、推理执行等全流程实战。通过Python代码示例和性能优化技巧，帮助开发者快速掌握昇腾平台的推理应用开发，提升AI模型部署效率。

#昇腾

昇腾Ascend C算子开发踩坑记：一个SetFlag/WaitFlag配对错误引发的NPU核异常与18分钟超时复位

本文详细分析了昇腾Ascend C算子开发中因SetFlag/WaitFlag配对错误导致的NPU核异常与18分钟超时复位问题。通过实际案例，揭示了手动同步机制的潜在风险，并提供了排查方法、正确用法及防御性编程建议，帮助开发者避免类似陷阱，提升算子开发效率与稳定性。

#昇腾

嵌入式开发实战：如何用CoreMark精准测试你的处理器性能（附完整代码解析）

本文详细介绍了如何使用CoreMark基准测试工具精准评估嵌入式处理器性能，包括测试环境搭建、代码深度解析及优化技巧。通过实战案例展示如何利用CoreMark测试结果指导硬件选型与软件优化，提升嵌入式系统开发效率。

从STM32转战C2000 F2800157：定时器配置的“水土不服”与快速上手指南

本文详细对比了STM32与TI C2000 F2800157在定时器配置上的关键差异，重点解析了CPU定时器的架构特点、配置步骤及中断处理流程。针对STM32开发者常见的配置误区，提供了实用的调试技巧和性能优化建议，帮助快速掌握C2000定时器的使用。

从Clion到VSCode：手把手教你配置OpenOCD作为嵌入式调试后端

本文详细介绍了如何在Clion和VSCode中配置OpenOCD作为嵌入式调试后端，涵盖Ubuntu环境下的安装、调试器设置及常见问题排查。通过实战步骤和高级技巧，帮助开发者实现跨IDE的无缝调试体验，提升嵌入式开发效率。

FreeRTOS定时器防抖实战：用软件定时器搞定按键抖动，附STM32完整代码

本文详细介绍了如何利用FreeRTOS软件定时器实现按键防抖功能，通过xTimerResetFromISR等API与中断服务的协同工作，提供了一种高效且低成本的解决方案。文章包含STM32完整代码实现，适用于智能家居、工业控制等高实时性要求的场景，显著提升系统可靠性。

共 138 条

请选择