koharu123 个人主页

@u012316485

koharu123

2024-10-30 19:51:26 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

CrewAI ：多智能体开发

CrewAI是一个轻量级Python框架，用于构建和协调多智能体(AI Agent)协作系统。它通过角色分工和任务编排，模拟真实团队的工作流程。框架包含四个核心概念：Agent(定义角色和能力的智能体)、Task(具体工作任务)、Crew(协作团队)和Process(执行流程)。开发者可以轻松配置智能体的专业领域、工具集和使用的LLM模型，并通过任务依赖关系建立工作流。CrewAI支持动态参数输入

#人工智能

A2A（Agent-to-Agent）协议解析

A2A协议摘要：该协议解决了多Agent系统的碎片化问题，通过定义统一通信规范实现跨平台互操作。

第 04 篇：数据加载的完整链路——Dataset 和 DataLoader

本文详细讲解了如何从零开始构建PyTorch数据加载管道。主要内容包括：数据加载的核心流程：从原始文件到模型输入 Dataset和DataLoader的分工设计实现自定义Dataset类处理图片分类任务 transforms预处理和数据增强技巧 DataLoader关键参数解析（batch_size、shuffle等）处理文件损坏等边界情况完整训练循环示例 CSV管理数据集等实用技巧文章

#人工智能 #深度学习 #pytorch

大模型后训练全解：SFT、RLHF/PPO、DPO 的原理、实践与选择

本文系统介绍了大语言模型后训练（Post-Training）的核心技术，包括SFT监督微调、RLHF强化学习对齐和DPO直接偏好优化。SFT通过高质量指令-回答对训练模型遵循指令；RLHF利用人类偏好数据训练奖励模型，通过PPO算法优化模型输出；DPO则简化了RLHF流程，直接优化偏好对差异。文章还介绍了DeepSeek-R1提出的GRPO新范式，特别适用于可验证推理任务。针对不同应用场景，作者提

#人工智能

变分自编码器（VAE）原理应用完整指南

本文系统介绍了变分自编码器(VAE)的理论框架与实现细节。首先从普通自编码器的局限性出发，指出其潜空间缺乏结构性；随后引入概率视角，通过变分推断推导出证据下界(ELBO)目标函数，分解为重建项和正则项；详细讲解了VAE的神经网络实现，包括重参数化技巧和KL散度的解析解；最后分析了VAE生成图像模糊的原因。文章完整呈现了从基础自编码器到现代VAE的理论演进，为理解其在生成模型中的应用奠定基础。

#深度学习

模型剪枝方法全解

文章摘要：本文系统梳理了神经网络剪枝技术的完整脉络。首先指出过参数化现象是剪枝的动机，解释了经典三阶段剪枝流程（训练-剪枝-微调）。详细对比了非结构化剪枝（细粒度但硬件不友好）和结构化剪枝（硬件友好但粒度粗）的优缺点，介绍了NVIDIA 2:4稀疏方案。重点讨论了重要性判据（幅值、梯度、激活值等）和剪枝时机（训练后/中/初始化）。针对LLM时代的新挑战，深入分析了SparseGPT（二阶补偿）和W

#剪枝 #算法 #机器学习 +3

第 03 篇：自动微分不神秘——梯度是怎么流动的

不用复杂的模型，就用最简单的手写线性回归：输入一个数，输出一个数，一个权重，一个偏置。但我们会把这个过程拆解到足够细，让你看清楚每一步背后发生了什么。

#pytorch #深度学习

第 02 篇：Tensor 是一切的基础——维度变换完全指南

本文系统介绍了PyTorch中的Tensor维度变换操作，这是理解深度学习模型实现的关键。

#人工智能 #深度学习 #自然语言处理 +1

共 23 条

请选择