Veggie张海寧个人主页

@weixin_43486255

Veggie张海寧

2022-11-29 10:17:38 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

基于Lance java sdk 实现千问 Qwen3.5 2B模型[safetensors格式] 加载并实现推理突破Java大模型部署壁垒：推理全流程实现与技术解析【Java PyTorch】

摘要：本文介绍了Java大模型部署领域的重大突破，成功实现Qwen3.5大模型在Java端的全流程推理，全程不依赖Python脚本。通过六大关键技术突破，包括Safetensors格式文件Zero-Copy转换、Hugging Face模型配置解析、高效加载5GB级模型等，实现了从模型加载到推理输出的纯Java闭环。文章详细阐述了推理实现的核心步骤，包括模型下载、配置解析、模型加载、分词器构建和推

#java #开发语言 #深度学习 +3

【Java PyTorch深度学习】PyTorch ON Java 实现Java版本PyTorch混合精度训练 GradScaler PyTorch Java[AI Infra]高校计算机硕士研一课程

本文介绍了基于JavaCPP-PyTorch实现混合精度训练(AMP)的方法，通过AutoCast上下文管理器和GradScaler梯度缩放器，在Java中1:1复现Python PyTorch的AMP功能。混合精度训练通过FP16/BF16降低显存占用，同时使用GradScaler防止梯度下溢。文章提供了完整的Maven项目配置，包含PyTorch GPU版本和相关CUDA依赖，可直接用于工业级

#深度学习 #人工智能 #java

【Java PyTorch深度学习】PyTorch ON Java 首次系统性实现Java PyTorch版本模型量化训练Quantization PyTorch Java高校计算机硕士研一课程

本文介绍了基于JavaCPP-PyTorch实现PyTorch模型量化的全流程框架。该框架解决了Java端量化API缺失、显存泄漏风险等核心挑战，完整复现了动态量化、训练后静态量化(PTQ)和量化感知训练(QAT)三大核心能力。文章详细阐述了量化基础概念、框架设计思路以及关键代码实现，包括量化枚举配置、参数计算、观测器设计等核心模块。该Java量化框架严格对标Python生态的torch.ao.q

#深度学习 #java #pytorch

【Java PyTorch深度学习】PyTorch ON Java 首次系统性实现Java PyTorch版本FSDP分片分布式训练【AI Infra】PyTorch Java高校计算机硕士研一课程

摘要：本文探讨了在Java生态下实现PyTorch FSDP（全分片数据并行）分布式训练的方法，旨在解决Python训练与Java部署的生态割裂问题。文章首先对比了DDP与FSDP的核心差异，指出FSDP通过参数分片显著降低单卡内存占用，适合超大规模模型训练。随后详细介绍了基于JavaCPP-PyTorch的FSDP实现方案，包括分布式初始化、模型分片包装、前向/反向传播流程等关键技术点，并提供了

#深度学习 #人工智能 #java

【Java PyTorch深度学习】PyTorch ON Java 首次系统性实现Java PyTorch版本DDP并行分布式训练【AI Infra3.】PyTorch Java高校计算机硕士研一课程

本文介绍了使用Java语言实现PyTorch分布式数据并行(DDP)训练的全过程。主要内容包括：环境配置：详细说明了Java PyTorch开发所需的环境配置，包括JDK 26.0.1、PyTorch Java依赖、CUDA 13.1等，并提供了Maven依赖配置示例。核心实现：展示了分布式采样器(DistributedSampler)的Java代码，该采样器负责将数据集划分到不同进程中，支持

#深度学习 #人工智能 #java

【Scala PyTorch深度学习】PyTorch On Scala系列课程第十四章 29 PyTorch模型扩展自定义Module【AI Infra3】[PyTorch Scala硕士研一课程】

本文介绍了如何在PyTorch Scala中通过继承torch.nn.Module来创建自定义模块。主要内容包括：自定义模块的核心构成： __init__方法用于定义和初始化子模块、参数和缓冲区 forward方法实现具体计算逻辑关键实践建议：在__init__中调用super().__init__() 使用register_buffer管理不可学习状态保持模块功能专注和可组合清晰定义输

#深度学习 #人工智能 #scala

【Scala PyTorch深度学习】PyTorch On Scala系列课程第十章 20 ：高级神经网络Transformer【AI Infra 3.0】[PyTorch Scala硕士研一课程]

本文介绍了PyTorch的自定义扩展与互操作性，重点讲解了如何构建C++扩展来提升计算性能、集成现有C++库或实现专用算法。主要内容包括：使用torch::Tensor类进行C++张量操作，通过setup.py设置构建流程，编写包含Pybind11绑定的C++源文件，以及编译和使用自定义扩展。此外还简要提及了与Autograd集成的方法，需要定义前向和后向传播来实现自动微分。通过这些技术，开发者可

#深度学习 #人工智能 #scala

2026大数据寒冬实锤：Spark/Flink批量优化裁员，AI For Data 流水线上线，3人干原来10人活【Java PyTorch深度学习】PyTorch On Java避险涨薪全攻略

2026年大数据行业迎来深度调整，传统Spark/Flink岗位面临批量裁员，企业转向AI驱动的数据智能流水线。PyTorch On Java成为Java开发者转型关键，提供低门槛AI落地方案，实现3人替代10人团队的效能提升。文章详细解析行业趋势、技术优势及实操指南，包括环境搭建、神经网络实现等核心代码示例。面对行业洗牌，掌握Java+AI复合技能成为开发者抵御裁员风险、实现薪资增长的核心竞争力

#大数据 #人工智能 #深度学习

【Java PyTorch深度学习】PyTorch On Java 进阶课程 Flink特征工程与PyTorch实时特征工程与流式推荐系统[PyTorch Java 硕士研一课程]

本文介绍了一个基于Apache Flink和JavaCPP-PyTorch的实时推荐系统解决方案。系统采用Flink 2.2.0处理实时用户行为数据，通过JavaCPP-PyTorch 2.10-1.5.13实现MIND算法，解决了传统推荐系统中实时性差、流式训练困难等问题。方案包含实时数据接入层、特征工程层和流式训练推荐层，严格遵循MIND论文实现嵌入层、行为胶囊聚合、动态路由等核心逻辑。文章详

#深度学习 #java #pytorch

【Java深度学习】PyTorch On Java 系列课程第十二章 24 ：PyTorch模型部署和性能优化【AI Infra 3.0】[PyTorch Java 硕士研一课程]

本章介绍了PyTorch模型部署和性能优化的关键技术。主要内容包括：使用TorchScript进行模型序列化的两种方法（追踪和脚本化），模型压缩技术（量化与剪枝），性能分析工具PyTorch Profiler的使用，以及模型导出为ONNX格式和TorchServe部署方案。重点讲解了TorchScript追踪方法的具体实现，通过Java代码示例演示了如何将PyTorch模型转换为可序列化的Scri

#深度学习 #人工智能 #java

共 93 条

请选择