logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习-从神经网络入门(图文讲解)

深度学习利用多层神经网络进行复杂模式识别,主要模型包括感知机和前馈神经网络(FFNN)。感知机是最简单的两层神经网络,用于线性二分类问题。FFNN则包含输入层、隐藏层和输出层,通过非线性变换处理复杂问题。FFNN的训练过程包括参数初始化、前向传播、反向传播和参数更新,最终最小化损失函数。FFNN在Transformer等模型中发挥重要作用,通过非线性变换和特征整合处理复杂任务。

文章图片
#深度学习#神经网络#人工智能
大模型训练技术:1概述

大模型训练分为预训练和后训练两阶段。预训练通过自回归或自编码方法从海量文本中学习通用语言知识;后训练则通过监督微调、强化学习等技术实现任务适配与偏好对齐。关键技术包括SFT(监督微调)、RLHF(人类反馈强化学习)、DPO(直接偏好优化)等,不同方法可组合使用:轻量任务用SFT+RSFT,高安全需求需SFT→DPO→领域适配。后训练流程需分阶段实施,先建立基础能力再优化生成质量,最终实现价值观对齐

文章图片
#人工智能#深度学习
多模态搜索系统实现详解:从文本到图像的智能检索架构

多模态搜索系统架构解析 本摘要概述了一个先进的建材产品多模态搜索系统,融合文本、图像和混合搜索功能。系统核心架构包含以下关键组件: 数据处理层: 从MySQL提取产品数据并进行清洗转换 图像预处理流程包括下载、格式转换和智能压缩 严格的数据质量评估标准确保数据可靠性 向量数据库层: 采用Milvus实现高性能向量检索 精心设计的表结构支持多模态特征存储 分离式架构确保可扩展性和高可用性 核心功能特

文章图片
#milvus#python
MCP技术深度指南:从开发到测试的完整实战手册

MCP技术实战指南:从开发到测试 MCP(Model Context Protocol)是AI领域的统一接口标准,旨在解决AI助手的"功能孤岛"问题。本文介绍了使用FastMCP框架快速构建MCP服务器的完整流程: 环境搭建:推荐使用uv工具快速初始化Python环境 基础开发:通过装饰器定义工具、资源和提示模板 进阶示例:建材产品查询服务的完整实现 关键特性:支持异步操作、进

文章图片
#python
深度学习-从神经网络入门(图文讲解)

深度学习利用多层神经网络进行复杂模式识别,主要模型包括感知机和前馈神经网络(FFNN)。感知机是最简单的两层神经网络,用于线性二分类问题。FFNN则包含输入层、隐藏层和输出层,通过非线性变换处理复杂问题。FFNN的训练过程包括参数初始化、前向传播、反向传播和参数更新,最终最小化损失函数。FFNN在Transformer等模型中发挥重要作用,通过非线性变换和特征整合处理复杂任务。

文章图片
#深度学习#神经网络#人工智能
大模型训练技术:1概述

大模型训练分为预训练和后训练两阶段。预训练通过自回归或自编码方法从海量文本中学习通用语言知识;后训练则通过监督微调、强化学习等技术实现任务适配与偏好对齐。关键技术包括SFT(监督微调)、RLHF(人类反馈强化学习)、DPO(直接偏好优化)等,不同方法可组合使用:轻量任务用SFT+RSFT,高安全需求需SFT→DPO→领域适配。后训练流程需分阶段实施,先建立基础能力再优化生成质量,最终实现价值观对齐

文章图片
#人工智能#深度学习
大模型训练技术:1概述

大模型训练分为预训练和后训练两阶段。预训练通过自回归或自编码方法从海量文本中学习通用语言知识;后训练则通过监督微调、强化学习等技术实现任务适配与偏好对齐。关键技术包括SFT(监督微调)、RLHF(人类反馈强化学习)、DPO(直接偏好优化)等,不同方法可组合使用:轻量任务用SFT+RSFT,高安全需求需SFT→DPO→领域适配。后训练流程需分阶段实施,先建立基础能力再优化生成质量,最终实现价值观对齐

文章图片
#人工智能#深度学习
深度学习-激活函数和损失函数(图文讲解)

深度学习模型中,激活函数和损失函数是关键组件。激活函数(如ReLU、Sigmoid)为网络引入非线性能力,使模型能拟合复杂数据模式;损失函数(如MSE、交叉熵)则评估预测误差,指导参数优化。二者协同工作于前向传播和反向传播过程中,共同推动模型训练。不同类型的激活函数适用于不同网络层(如Softmax用于输出层),而损失函数的选择则取决于任务性质(回归/分类)。合理搭配二者对模型性能至关重要。

文章图片
#深度学习#人工智能
大模型训练技术:1概述

大模型训练分为预训练和后训练两阶段。预训练通过自回归或自编码方法从海量文本中学习通用语言知识;后训练则通过监督微调、强化学习等技术实现任务适配与偏好对齐。关键技术包括SFT(监督微调)、RLHF(人类反馈强化学习)、DPO(直接偏好优化)等,不同方法可组合使用:轻量任务用SFT+RSFT,高安全需求需SFT→DPO→领域适配。后训练流程需分阶段实施,先建立基础能力再优化生成质量,最终实现价值观对齐

文章图片
#人工智能#深度学习
RAG(Retrieval Augmented Generation)检索增强技术解析

RAG(检索增强生成)技术解决了大语言模型的知识局限性问题。其核心流程分为检索和生成两个阶段:首先通过语义检索从知识库中获取相关内容,再结合检索结果生成准确回答。语义检索利用向量化技术将文本转换为数字向量,通过计算向量相似度找出语义相近的内容。系统构建涉及文本拆分、向量化、索引优化等步骤,并可通过重排序和提示工程提升回答质量。RAG的优势包括知识实时更新、回答可追溯、准确性高等特点,已成为增强大模

文章图片
#人工智能
到底了