Jerry Jho 个人主页

@weixin_29051245

Jerry Jho

2023-08-14 11:27:30 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

YOLO与3D点云融合：从2D检测到3D感知的毕业设计实战指南

目标检测是计算机视觉的核心任务，旨在从图像中定位并识别物体。传统方法如YOLO在2D平面上表现出色，但现实世界是三维的，需要感知物体的深度、位置和朝向。3D目标检测通过处理点云等数据，输出包含中心点、尺寸和朝向的3D边界框，为自动驾驶、机器人等应用提供关键几何信息。其技术价值在于将丰富的2D纹理信息与精确的3D几何结构相结合，实现更鲁棒的环境感知。常见的应用场景包括自动驾驶的车辆检测、机器人的物体

#目标检测

大模型MoE架构揭秘：为什么GPT-4只用2%参数

稀疏专家混合（MoE）是突破大模型显存墙与计算效率瓶颈的核心范式。其原理在于将超大规模参数拆分为多个专用子网络，通过动态路由机制按需激活少数专家，实现计算负载的智能调度。这种设计显著降低显存占用与FLOPs消耗，提升硬件利用率，支撑高吞吐、低延迟的工业级推理服务。典型应用场景包括金融风控、政务问答、多模态生成等对响应时效与成本敏感的线上AI系统。关键技术价值体现在资源弹性调度、训练稳定性增强及能效

YOLOv5s-6.0网络结构图深度解析与演进对比

本文深度解析了YOLOv5s-6.0网络结构图的优化与演进，重点对比了CSP1_X与CSP2_X的差异及SPPF模块的创新设计。通过实测数据展示6.0版本在推理速度、模型大小等方面的显著提升，为边缘设备部署提供实用建议。文章还分享了网络结构调整技巧和可视化工具实操方法，助力开发者高效应用这一轻量级目标检测模型。

#目标检测

KV Cache显存爆炸原理与实战优化指南

KV Cache是大语言模型推理中关键的缓存机制，用于避免自回归解码过程中的重复计算，其内存占用随上下文长度和并发数线性增长，成为GPU显存瓶颈的主因。其核心原理源于Transformer的Self-Attention需复用历史Key/Value向量，工程上通过GQA（分组查询注意力）降低头数、Sliding Window（滑动窗口）限制缓存长度，实现显存从O(T)到O(W)的压缩。该机制直接影响

函数计算部署Qwen3.5大模型：零配置实践指南

Serverless架构正在重塑AI模型部署方式，其核心原理是通过事件驱动按需分配计算资源，实现免运维和自动扩缩容。函数计算作为典型Serverless服务，特别适合大型语言模型(LLM)这类计算密集型应用。通过模型量化技术如GPTQ，可将72B参数的Qwen3.5压缩到20GB左右，结合GPU实例的显存优化策略，实现在单卡环境的高效推理。这种技术方案大幅降低了LLM的使用门槛，使中小团队也能快速

2026年程序员必备：大模型技术核心能力与应用指南

大语言模型作为AI领域的重要突破，正在重塑软件开发范式。其核心原理是基于海量数据训练的深度学习模型，具备代码生成、补全与理解能力，显著提升开发效率。在工程实践中，大模型可应用于代码自动生成、遗留系统重构、自动化测试等场景，成为开发者的生产力倍增器。以GitHub Copilot为代表的工具已能处理70%的样板代码，而通过提示词工程优化交互方式，开发者可进一步释放大模型潜力。掌握大模型技术将成为未来

深度学习在大地电磁反演中的应用与优化

大地电磁法（MT）是地球物理勘探中的关键技术，广泛应用于地热资源勘查和油气田探测。传统反演方法如Occam和NLCG依赖线性化近似，难以处理复杂地质构造。深度学习通过神经网络架构，显著提升了反演效率和准确性。DIMT-Net系统结合改进型ResNet模块和U-Net跳跃连接，实现了三维反演效率提升17倍，复杂构造识别准确率提高23个百分点。该技术在云南地热田和内蒙古金属矿区验证中表现出色，成功识别

#深度学习

GPT-5不存在？当前免费可用的大模型能力真相

大语言模型（LLM）是推动AI应用落地的核心技术，其演进遵循算力、数据与算法协同优化的客观规律。从GPT-3.5到GPT-4o，模型在多模态理解、响应速度与成本效率上持续突破，但所有公开版本均未跳过GPT-4直接进入所谓‘GPT-5’阶段——该名称目前无官方定义、无API支持、无可信评测，属于典型的技术误传。真实的技术价值体现在可及性：GPT-4o、Claude 3.5 Sonnet与Gemini

国产AI大模型横评：7款主力模型真实办公场景深度实测

大语言模型（LLM）作为当前人工智能落地的核心载体，其实际生产力表现远不止于参数规模或基准测试分数。理解中文语义、处理长文本、生成可执行代码、解析PDF等能力，共同构成企业级AI应用的技术底座。本文聚焦国产AI大模型在真实办公流中的综合表现，基于合同解析、数据分析、代码调试、多轮会议纪要等12个高频工作流任务，实测通义千问Qwen2-72B、DeepSeek-V2、Kimi Chat等七款主流模型

国内大模型实战生存指南：选型逻辑与工作流适配

大语言模型（LLM）作为人工智能模型的核心形态，其技术价值不在于参数规模或榜单排名，而在于对真实工作流的深度适配能力。理解模型原理需关注上下文长度、长文本检索准确率与指令遵循稳定性三大硬指标；开源模型虽提供数据自主权，但工程成本远超下载门槛；行业大模型的本质是领域语料沉淀与专用接口封装，而非简单微调。在AIGC内容创作、合同审查、多模态生成等高频场景中，模型表现差异源于训练数据分布与解析架构——如

#AIGC

共 114 条

请选择