AI大模型探索者个人主页

@weixin_53880910

AI大模型探索者

2024-08-22 13:59:24 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从零搭建Pytorch模型教程（七）单机多卡和多机多卡训练

本文主要介绍单机多卡训练和多机多卡训练的实现方法和一些注意事项。其中单机多卡训练介绍两种实现方式，一种是DP方式，一种是DDP方式。多机多卡训练主要介绍两种实现方式，一种是通过horovod库，一种是DDP方式。

#pytorch #人工智能 #python +3

【AI大模型】LLaMa羊驼大模型详解

LLaMa模型结构：前面的词预测后面的词，经典的解码结构。位置编码用的是旋转自编码。大语言模型为什么取名为LLaMa（美洲鸵）？LLM发音困难。两个LL跟绕口令一样挑战舌头。大家想给它加点原音，帮助发音。有人加了A，就是LLaMa。3.模型的训练和数据：65B的模型使用2048块A100 80G的GPU，训练21天左右。（训练成本还是比较高的，训练的数据集同GPT一样）LLaMa模型训练的数据集。

#人工智能 #深度学习 #机器学习 +1

神经网络算法 - 一文搞懂ANN（人工神经网络）

本文将从**生物神经网络、人工神经网络、神经网络训练、、分类与应用、** 四个方面，带您一文搞懂人工神经网络ANN。

#神经网络 #算法 #人工智能 +1

NLP理解层次：从认知到理解的六个维度

在NLP的框架中，理解层次是一个核心概念，它揭示了人类思维和沟通的复杂结构。NLP认为，我们的思维和行为可以通过改变对问题的理解层次来影响。理解层次由低到高分为六个层次，每个层次都对应着不同的思考深度和行动策略。

#自然语言处理 #人工智能 #语言模型 +1

强化学习——基本概念

强化学习（Reinforcement Learning）是机器学习的一种，它通过与环境不断地交互，借助环境的反馈来调整自己的行为，使得累计回报最大。*强化学习要解决的是决策问题——求取当前状态下最优行为或行为概率。*强化学习包括智能体和环境两大对象，智能体是算法本身，环境是与智能体交互的外部。

#人工智能 #深度学习 #机器学习 +1

【AI大模型】Prompt Engineering

模型训练者并没想到过会这样，完全是大家「把 Al 当人看」玩出的一个用法实在传得太广，导致现在的大模型训练数据里充满了角色定义，所以更有效了先定义角色，其实就是在开头把问题域收窄，减少二义性。别急着上代码，先尝试用 prompt 解决，往往有四两拨千斤的效果但别迷信 prompt，合理组合传统方法提升确定性，减少幻觉想让 AI 做什么，就先给它定义一个最擅长做此事的角色用好思维链，让复杂逻辑/计算

#人工智能 #深度学习 #机器学习 +1

一文彻底搞懂大模型 - Agent（智能体）

什么是LLM Agent？大模型Agent是一种构建于大型语言模型（LLM）之上的智能体，它具备环境感知能力、自主理解、决策制定及执行行动的能力。Agent是能够模拟独立思考过程，灵活调用各类工具，逐步达成预设目标。在技术架构上，Agent从面向过程的架构转变为面向目标的架构，旨在通过感知、思考与行动的紧密结合，完成复杂任务。

#人工智能 #语言模型

解读提示工程（Prompt Engineering）

Prompt提示是什么呢？Prompt提示是模型接收以生成响应或完成任务的初始文本输入。我们给AI一组Prompt输入，用于指导模型生成响应以执行任务。这个输入可以是一个问题、一段描述、一组关键词，或任何其他形式的文本，用于引导模型产生特定内容的响应。例如，在chatGPT中，用户通常使用 prompt 来与大语言模型进行交互，请求回答问题、生成文本、完成任务等。模型会根据提供的 prompt 来

#人工智能 #语言模型

神经网络算法 - 一文搞懂CNN（卷积神经网络）

本文将从CNN解决了什么问题、人类的视觉原理、CNN的基本原理、典型的CNN及实际应用四个方面，带您一文搞懂卷积神经网络CNN。

#神经网络 #算法 #cnn

神经网络算法 - 一文搞懂RNN（循环神经网络）

本文将从RNN解决了什么问题、RNN的基本原理、RNN的优化算法、RNN的应用场景四个方面，带您一文搞懂循环神经网络RNN。

#神经网络 #算法 #rnn +3

共 16 条

请选择