logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

常见Loss函数和大模型Loss计算过程

本文介绍了深度学习中的损失函数应用和Transformer模型的训练方法。在损失函数方面,详细说明了交叉熵损失(适用于多分类)、二元交叉熵损失(适用于二分类)和均方误差损失(适用于单输出任务)的原理和应用场景。在Transformer训练方面,重点阐述了预训练数据的预处理流程(包括数据清洗、去重等关键步骤)和两种主要的数据切分方法(滑动窗口和拼接打包),以及如何构建训练批次和处理填充标记。此外,还

#人工智能#机器学习#深度学习
LangChain4j实战

本文介绍了如何在Java项目中集成LangChain4j与阿里云百炼平台API,主要包括以下内容:1) API-KEY申请与配置,通过Spring配置类或yml文件设置OpenAI模型参数;2) 使用AIServices创建动态代理接口,实现对话、格式化JSON输出和流式响应功能;3) 实现记忆功能,通过Redis存储对话上下文;4) RAG知识库应用,使用Milvus向量数据库存储和检索文档;5

文章图片
#java#intellij-idea#ide
到底了