weixin_30721077 个人主页

@weixin_30721077

weixin_30721077

2023-04-17 10:11:44 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

PyTorch模型部署前必做：用这个脚本精准测量你的FPS（支持batch size调整与warmup）

本文详细介绍了如何开发一个生产级的PyTorch模型性能评估工具，重点解决GPU测量失真、warmup机制和batch size调整等核心问题。通过科学的FPS测量方法，帮助开发者在模型部署前精准评估推理效率，优化GPU和CPU资源利用，提升工业级应用的性能表现。

#性能优化 #GPU

别再乱用AdaptiveAvgPool2d了！PyTorch实战中连接卷积与全连接层的正确姿势

本文深入探讨了PyTorch中`AdaptiveAvgPool2d`的正确使用方法，揭示了其在连接卷积层与全连接层时的常见陷阱与解决方案。通过CIFAR-10分类项目的实战案例，详细讲解了如何精确计算池化参数、动态调整网络结构，并对比了不同配置的性能差异。文章还介绍了全局平均池化(GAP)和全卷积网络(FCN)等现代替代方案，帮助开发者避免特征损失，提升模型效率。

#深度学习

PyTorch 2.0 Tensor 类型转换：5种方法性能对比与显存占用实测

本文深入评测了PyTorch 2.0中五种Tensor类型转换方法的性能差异，包括.to()、type()、构造函数等，通过实测数据对比转换延迟、吞吐量和显存占用，为开发者提供优化建议。重点关注GPU/CPU环境下的性能瓶颈与显存管理，帮助提升深度学习模型训练效率。

#性能优化

Coding Plan 是什么？大模型编程中的任务分解协议

Coding Plan 是一种面向IDE的大模型任务分解协议，本质是将模糊的编程请求转化为结构化、可验证、可干预的执行纲要。其原理基于认知过程显性化——通过分步规划替代端到端生成，使AI输出具备可审查性与协作性。技术价值在于打破‘黑盒生成’瓶颈，实现开发者决策权与模型执行权的清晰切分。典型应用场景包括前端重构、遗留系统微服务化、Vue2→Vue3渐进式升级等复杂工程任务。当前已超越Claude C

Andrej Karpathy：从深度学习理论到特斯拉自动驾驶的AI工程实践

深度学习作为人工智能的核心技术，通过神经网络模拟人脑学习机制，实现了从数据中自动提取特征的突破。其原理基于多层非线性变换，能够处理复杂的模式识别任务。在技术价值层面，深度学习显著提升了计算机视觉、自然语言处理等领域的性能上限，其中卷积神经网络在图像识别中的表现尤为突出。这种技术进步直接推动了自动驾驶、智能医疗等应用场景的落地。以特斯拉Autopilot系统为例，通过大规模数据驱动的迭代开发模式，实

#深度学习 #自动驾驶

大模型技术全景与职业发展指南

大模型技术作为人工智能领域的重要突破，正在重塑全球科技产业格局。其核心原理基于Transformer架构，通过海量数据训练和分布式计算实现智能涌现。在工程实践中，大模型技术展现出三大核心价值：提升任务性能、降低领域适配成本、创造新型应用场景。目前已在智能客服、内容生成、金融分析等领域实现规模化落地。随着ChatGPT等产品的爆发，大模型相关岗位需求呈现470%的年增长率，特别是大模型训练工程师和微

Stroke3D：从2D草图到可动画3D模型的革命性技术

3D建模技术正经历从专业工具向大众化创作的转变，其中基于深度学习的自动化生成方法成为关键突破点。Stroke3D技术通过创新的两阶段生成范式，首先从2D草图中重建3D骨架结构，再生成适配的蒙皮网格，实现了端到端的3D内容创作流程。这种骨架先行的设计确保了模型具有良好的拓扑结构和动画适配性，同时内置的智能权重预测大幅降低了手动调整的工作量。在游戏开发、教育可视化、工业设计等领域，这项技术能够将传统需

#深度学习

大模型显卡选型与优化实战指南

深度学习中的显卡选型是模型训练效率的关键因素，尤其在大模型时代更需精准匹配硬件能力。从技术原理看，显卡性能主要由计算能力（FLOPs）、显存容量和带宽决定，其中Tensor Core等架构创新大幅提升了混合精度计算效率。工程实践中，通过显存压缩技术（如LoRA、8-bit量化）和混合精度训练，可在保证模型精度的同时显著降低硬件需求。针对不同规模的LLM（如7B/70B参数模型），需综合评估消费级显

MeetingToM评测框架：多模态大模型的心理理论能力实战解析

心理理论（Theory-of-Mind）作为认知科学的核心概念，指的是个体推断他人心理状态的能力。在多模态人工智能领域，这一原理被扩展为模型理解人类意图、信念和情绪状态的技术能力。其技术价值在于突破传统单模态理解的局限，实现更深层次的人机交互。在多人会议、跨部门协作等复杂应用场景中，模型需要融合视觉、听觉和文本信息进行时空推理。MeetingToM评测框架正是基于这一需求，通过真实会议数据构建多模

Java开发者视角：AI三大核心技术解析与实践

人工智能核心技术中的大模型、向量和智能体是构建现代AI应用的三大支柱。大模型作为模式识别引擎，通过海量数据训练获得通用知识，但需要结合RAG等技术补充领域知识。向量技术将文本转换为数学表示，实现语义级别的相似度计算，突破了传统关键词匹配的局限。智能体则通过任务规划、工具调用和动态调整实现自动化流程。对于Java开发者而言，可以借助LangChain4j、Qdrant等成熟技术栈快速构建AI应用。这

#AI

共 102 条

请选择