logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【大模型】理论基础(4):通识扫盲,一文搞清楚大模型的分类、训练、微调、部署

摘要:本文系统介绍了大模型开发的核心流程和关键技术。首先阐述了预训练(获取基础能力)、微调(增强专项能力)和部署(模型服务化)的概念及相互关系。其次详细说明了基于HuggingFace标准的模型训练方法,包括代码库和可视化平台两种途径。然后列举了SFT、RLHF、DPO等主流微调技术,以及LORA、RAG等增强手段。最后对模型进行了系统分类,涵盖文本理解、生成、多模态等8大类典型任务,并指出虽然应

文章图片
#深度学习#人工智能
【监控】Spring Boot+Prometheus+Grafana实现可视化监控

快速讲解Prometheus+grafana实现spring boot的可视化监控。

文章图片
#spring boot#prometheus#grafana
【大模型】理论基础(3):transformer,模型架构的基座

本文概述了Transformer模型的核心机制。首先通过分词和词嵌入将输入转换为向量,并加入位置信息。关键在于自注意力机制:使用QKV矩阵计算词间关联,通过多头注意力整合上下文信息。编码器通过残差网络和归一化处理梯度消失问题,解码器则利用掩码和交叉注意力生成输出。最终将上下文向量投影到词汇空间,预测下一个词。Transformer通过这一系列操作实现语义理解与生成,每个步骤均保持512维向量不变。

文章图片
#搜索引擎
【文档数据库】ES和MongoDB的对比

都是用来存储文档的,ES和MongoDB到底有什么区别?一文聊懂。

文章图片
#数据库#mongodb#elasticsearch
从0开始搭建一个前端项目的架子

打开一个现在的前端项目:这还是我认识的html、css、js吗?别怕!从0开始搭建一个前端架子,包含脚手架、ui框架、css预处理等等,进来就明白。

文章图片
#前端#less
【文档数据库】ES和MongoDB的对比

都是用来存储文档的,ES和MongoDB到底有什么区别?一文聊懂。

文章图片
#数据库#mongodb#elasticsearch
数据库如何合理生成主键:UUID、雪花算法

自增主键的弊端以及常用主键生成算法生成合理主键。

文章图片
#数据库#java#开发语言
详解WebSocket

相信我,进来看看,一文聊明白websocket和JAVA中的websocket。

文章图片
#网络#java#websocket
【JAVA】javadoc,如何生成标准的JAVA API文档

一文详解如何使用JAVADOC来生成标准JAVA API文档。

文章图片
#java
    共 102 条
  • 1
  • 2
  • 3
  • 11
  • 请选择