logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习简介(Deep Learning)

深度学习(Deep Learning)是机器学习的分支,是一种以人工神经网络为架构对数据进行特征学习的算法。深度学习中的形容词“深度”是指在网络中使用多层。深度学习核心思想是通过模仿人脑的神经网络来处理和分析复杂的数据,从大量数据中自动提取复杂特征,擅长处理高维数据,如图像、语音和文本。

文章图片
#深度学习#人工智能
深度学习之循环神经网络RNN

文章摘要: 循环神经网络(RNN)是一种专门处理序列数据的神经网络,通过循环结构能够记忆历史信息,适用于时间序列和自然语言处理任务。RNN在文本生成、语音识别、时间序列预测等领域有广泛应用。词嵌入层是RNN处理文本的关键,将离散单词转换为连续向量表示(如使用PyTorch的nn.Embedding),捕捉语义关系并降低维度。RNN通过循环结构处理序列数据,保持文本的顺序特性,解决传统神经网络无法处

文章图片
#深度学习#rnn#人工智能 +1
深度学习之神经网络1(Neural Network)

神经网络是一种模仿生物神经网络的机器学习模型,由输入层、隐藏层和输出层组成。前向传播过程中,数据通过各层神经元进行加权计算和激活函数变换,最终产生预测结果。激活函数(如Sigmoid、Tanh等)为网络引入非线性因素,使其能拟合复杂函数。合理设置神经元权重和激活函数对网络性能至关重要。全连接神经网络中,相邻层神经元两两相连,每个连接都有权重参数。网络通过调整这些参数来学习数据特征,实现分类或回归任

文章图片
#深度学习#神经网络#人工智能
深度学习之神经网络2(Neural Network)

本文介绍了神经网络的核心优化方法。多层神经网络通过误差反向传播算法(BP)进行训练,BP算法利用链式法则计算梯度并更新权重。梯度下降法通过沿负梯度方向调整参数最小化损失函数,其变体包括批量、随机和Mini-Batch梯度下降。反向传播过程分为前向计算输出和反向传播误差两个阶段,文中通过具体示例详细解释了权值更新过程。针对梯度下降的局限性(如鞍点、局部最优),介绍了Momentum、AdaGrad等

文章图片
#深度学习#神经网络#人工智能
线性回归(Linear Regression)

本文介绍了线性回归的基本概念、分类及应用场景,并详细讲解了线性回归问题的求解方法。主要内容包括:一元与多元线性回归的区别;损失函数(MSE、MAE)的作用;导数和矩阵在回归分析中的应用;正规方程法和梯度下降算法两种求解方式。通过身高体重预测的实例演示了sklearn中线性回归API的使用流程,并阐述了梯度下降算法的核心思想——通过迭代寻找损失函数最小值。文章为机器学习初学者提供了线性回归的完整知识

文章图片
#线性回归#算法#回归
RNN及其变体

本文介绍了RNN及其变体模型在自然语言处理中的应用。首先概述了RNN的定义、应用场景和常见分类方式(按输入输出结构和内部结构划分)。随后详细解析了传统RNN、LSTM和GRU的内部结构及实现代码,重点说明了LSTM的遗忘门、输入门、细胞状态和输出门机制,以及GRU的更新门和重置门机制。文中还介绍了双向模型(BI-LSTM和BI-GRU)的工作原理。最后以人名分类任务为例,展示了RNN模型实际应用的

文章图片
#rnn#人工智能#深度学习
14.大语言模型微调语料构建

本文介绍了AI模型微调的基本步骤和工作流程实现方法。模型微调包括选择预训练模型、准备数据集、调整结构、设置参数、训练和评估部署等环节。针对数据集制作门槛高的问题,提出通过Dify工作流生成语料方案,该流程包含开始节点、文档解析、数据处理、LLM生成等阶段,最终输出符合要求的JSONL格式微调数据。测试结果显示,系统能成功生成包含system/user/assistant三角色的结构化训练数据,为普

文章图片
#语言模型#人工智能
13.Dify介绍

Dify是一款开源的大语言模型应用开发平台,提供BaaS服务,让开发者快速构建生成式AI应用。平台支持多种模型接入(推理、Embedding、语音转文字)、5种应用类型(聊天助手、文本生成等)和可视化工作流编排(包含多个功能节点)。其核心功能包括知识库管理(实现RAG技术)、灵活的流程设计以及多场景应用开发。安装需WSL和Docker环境,提供直观界面简化开发流程,适合从简单对话到复杂业务场景的A

文章图片
#docker
20.模型微调——Prompt-Tuning方法

NLP任务发展经历了四个范式:传统机器学习、深度学习、预训练微调和提示学习。Prompt-Tuning作为最新范式,通过构建模板和标签映射将下游任务转化为预训练任务,显著减少数据需求。其发展历程包括离散提示(GPT3、PET)和连续提示(PromptTuning、P-tuning、PPT)两种方法。连续提示通过参数化模板向量,解决了离散提示方差大的问题。该方法尤其适合大模型场景,可在冻结主模型参数

文章图片
#gpt-3#人工智能
Transformer模型

Transformer模型是2018年由Google团队提出的革命性架构,在BERT等模型中发挥核心作用。其核心优势在于并行计算能力和强大的特征提取性能。模型主要由输入部分(词嵌入+位置编码)、编码器(多头自注意力机制+前馈网络)、解码器三部分组成。输入部分通过词嵌入和三角函数位置编码实现文本表示;编码器采用多层结构,每层包含自注意力机制和规范化处理;解码器结构与编码器类似但增加跨注意力层。该架构

文章图片
#transformer#深度学习#人工智能
    共 40 条
  • 1
  • 2
  • 3
  • 4
  • 请选择