logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

第二章 机器学习基本概念

摘要:本文概述了机器学习的基本概念与原理。主要内容包括:(1)基本术语,如数据集、特征向量、分类与回归问题;(2)监督学习的定义与流程;(3)假设空间与版本空间的概念;(4)学习三要素,重点解释了损失函数及其期望值的重要性;(5)机器学习重要定理,包括奥卡姆剃刀和没有免费午餐定理;(6)训练误差与测试误差的区别,以及过拟合问题;(7)正则化与模型泛化能力;(8)生成模型与判别模型的比较。这些概念构

文章图片
#机器学习#人工智能
【大模型训练】分布式框架

计算速率=单设备计算速率*设备数*多设备并行效率(加速比)单设备计算速率提高:混合精度、算子融合、梯度累加。多设备并行效率提高:数据并行、模型并行、流水并行。训练耗时=训练数据规模*单步计算量/计算速率。设备数增加:服务器架构、通信拓扑优化。通过多种优化策略提高训练效率和。

文章图片
#分布式#学习
大模型学习(二)

AI Agent是基于LLM的能够自主理解、自主规划决策、执行复杂任务的智能体。Agent设计的目的是为了处理那些简单的语言模型可能无法直接解决的问题,尤其是当这些任务涉及到多个步骤AI Agent流程图规划(Planning):将大型任务分解成子任务,并规划执行任务的流程。智能体会对任务执行的过程进行反思和思考,从而决定继续执行任务,或判断任务已经完结并终止。记忆(Memory):短期记忆和长期

#学习
到底了