guyu0908 个人主页

@weixin_29912207

guyu0908

2023-08-16 10:58:12 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen3.6-35B-A3B：激活感知3比特量化技术解析与4090部署实践

大模型量化是平衡精度、显存与推理速度的核心技术，其中激活感知量化（Activation-aware Quantization）通过动态适配各层激活分布，显著提升低比特模型的数值保真度。A3B（Activation-aware 3-bit）作为新型联合权重量化与激活量化方案，突破传统INT4/INT2在35B级模型上的精度瓶颈，在RTX 4090单卡实现21.4GB显存占用与78.3% MMLU得分

四张Tesla T10部署Qwen3.5实现64K上下文本地推理

大语言模型本地化部署正成为企业AI落地的关键路径，其核心在于平衡算力、显存与长上下文支持能力。Qwen3.5凭借A3B动态计算结构和GPTQ-Int4量化兼容性，在低功耗GPU上展现出优异的推理效率；而Tesla T10虽属前代硬件，但16GB显存+高内存带宽特性，配合vLLM张量并行与Marlin后端优化，可稳定支撑64K token长上下文推理任务。该方案规避了公有云API调用限制与数据出境风

#vLLM

GPT-5.5 INT4与DeepSeek V4实测：AI模型本地化部署与长文本处理指南

大语言模型（LLM）和多模态模型正从云端服务走向本地可部署的工程化阶段。其核心原理涉及模型量化（如INT4精度压缩）、推理优化（如KV Cache调度、算子融合）与长上下文建模（如RoPE位置编码与分段锚定）。技术价值在于显著降低硬件门槛、提升国产算力适配效率，并支撑百万字级信息萃取等高价值场景。典型应用包括消费级显卡运行图像生成、昇腾/华为生态下的法律合同分析、以及跨模型协同的AI内容生产流水线

大语言模型2:4剪枝技术与Unified Pruning实践指南

模型剪枝是深度学习模型压缩的核心技术之一，通过移除神经网络中的冗余参数来降低计算和存储开销。2:4半结构化剪枝作为一种新兴方法，在硬件加速和性能保持之间取得了平衡，特别适合大语言模型部署。该技术利用现代GPU的专用指令集，可实现1.2-1.4倍的推理加速，同时显著减少模型体积。Unified Pruning方法通过结合局部显著性度量和全局预算分配，解决了传统剪枝在高稀疏度下的性能下降问题。在实际应

2026年AI编程实战指南：从工具选型到生产级人机协作

AI编程已超越‘能否写代码’的基础阶段，进入工程化落地深水区。其核心是理解大语言模型在软件开发链路中的定位——不是替代开发者，而是作为可编排、可验证、可审计的智能协作者。关键技术原理包括RAG增强的本地知识库构建、top_p与presence_penalty协同的生成可控性调优、以及基于ArchUnit和JaCoCo的AI代码准入校验机制。这类技术组合显著提升代码生成准确率与架构合规性，广泛应用于

QLoRA微调Llama 2实战：消费级显卡跑通7B大模型

大语言模型微调本质上是让预训练模型适配特定任务的参数调整过程，其核心原理在于冻结主干、仅更新轻量适配模块。QLoRA通过低秩分解（LoRA）与4-bit量化（NF4）双重压缩，在保障精度损失可控（<0.5%）的前提下，将Llama 2-7B的显存需求从45GB压降至12GB以内，使RTX 3090/4090、M2 Ultra等消费级硬件具备端到端微调能力。该技术显著降低AI落地门槛，支撑销售话术生

告别手动标注！用LabelImg + Python脚本一键批量转换VOC到YOLO格式

本文详细介绍了如何使用LabelImg和Python脚本实现VOC到YOLO格式的批量转换，解决目标检测项目中数据标注格式转换的痛点。通过核心算法解析和完整代码示例，帮助开发者高效完成自动化转换，提升数据准备效率，适用于大规模数据集处理。

#目标检测

告别人工抄表：我是如何用Python+深度学习搞定老旧水表自动识别的？

本文分享了如何利用Python和深度学习技术（特别是CRNN模型）实现老旧水表自动识别的实战案例。通过CRNN+CTPN组合架构，解决了复杂环境下水表读数识别的难题，显著提升了抄表效率和准确性，为老旧小区智能化改造提供了低成本解决方案。

#深度学习

保姆级教程：用Python+微分方程搞定2024美赛A题（七鳃鳗性别比例建模）

本文提供了一份保姆级教程，详细讲解如何利用Python和微分方程构建七鳃鳗性别比例动力学模型，适用于2024美赛A题的数学建模。通过生态学原理与工程化思维的结合，展示了从模型设计、微分方程实现到参数敏感性分析和结果可视化的完整流程，帮助参赛者快速掌握数学建模的核心技能。

保姆级教程：用Python代码逐行解析DeepSort的级联匹配（附避坑指南）

本文详细解析了DeepSort算法中的级联匹配机制，通过Python代码逐行讲解其实现细节，包括优先级匹配和双重距离度量。文章还提供了常见问题的解决方案和优化建议，帮助开发者更好地理解和应用多目标跟踪技术。

共 175 条

请选择