logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型笔记_常见术语

本文系统整理了AI领域的核心术语与概念,涵盖基础概念、模型架构、注意力机制、训练方法等8大类别。重点包括:基础概念如AI、AGI、LLM;模型架构如Transformer、GPT、BERT;训练方法如预训练、微调、RLHF;以及评估指标和推理优化技术。这些术语构成了当前AI研究与应用的技术框架,反映了从基础理论到前沿方法的发展脉络。文章以结构化方式呈现术语全称、中文翻译及简明定义,为读者提供了一份

#语言模型
大模型笔记_常见术语

本文系统整理了AI领域的核心术语与概念,涵盖基础概念、模型架构、注意力机制、训练方法等8大类别。重点包括:基础概念如AI、AGI、LLM;模型架构如Transformer、GPT、BERT;训练方法如预训练、微调、RLHF;以及评估指标和推理优化技术。这些术语构成了当前AI研究与应用的技术框架,反映了从基础理论到前沿方法的发展脉络。文章以结构化方式呈现术语全称、中文翻译及简明定义,为读者提供了一份

#语言模型
mybatis的dao层只有接口没有实现,如何工作的-笔记

一、问题引入mybatis在写dao层的时候只是写了个接口,并没有具体实现,如何正常工作的?其实最初开发web的时候是需要写dao接口的实现,只是后面mybatis简化了我们的开发模式,将“dao层的实现”这部分重复代码给我们自动生成了,不需要手动写了。我们先回顾下“需要写dao实现的传统开发模式” 和 “不需要写dao实现的代理开发模式”,再看看mybatis是如何做到这点的。二、传统开发 VS

文章图片
#spring#java#mybatis
大模型笔记-“训练”和“推理”概念

在大模型的资源管理和开发流程中,训练和推理是两个核心阶段。训练是模型通过大量数据和计算资源学习数据规律的过程,需要高性能GPU集群和长时间计算,目标是生成模型权重参数。推理则是将训练好的模型应用于实际场景,对新数据进行预测或生成结果,要求高效和低成本,通常使用单卡GPU或专用推理芯片。

大模型笔记_token概念

注: 下述内容整理自大模型回答。提问:请用一个15岁中学生能听懂的语言,介绍下大模型术语 token好的!让我用简单易懂的语言来解释一下 Token 是什么。你可以把 Token 想象成是组成语言的一块块小积木。当我们用电脑处理文字时,电脑并不能直接理解整个句子或段落,它需要把文字拆成更小的部分,这些部分就是 Token。所以,Token 就像是电脑用来理解语言的基本单位。虽然有时候一个 Toke

设计模式笔记_行为型_访问者模式

访问者模式是一种行为设计模式,允许在不修改对象结构的情况下定义新操作。该模式将操作逻辑与对象结构分离,通过Visitor接口定义操作,由具体访问者(如ArtLoverVisitor)实现不同行为。被访问对象(如Painting)实现Element接口的accept方法,接受访问者访问。ObjectStructure(如Museum)管理元素集合并提供遍历访问的接口。优点是新增操作方便、符合单一职责

#设计模式#访问者模式
python uniform 函数

python的 uniform 函数

#python
pkl文件,csv文件,tsv文件

pkl文件,csv文件,tsv文件

#python
ROC曲线与AUC计算-笔记

介绍ROC和AUC相关内容

文章图片
Mac终端配置-笔记

mac终端默认显示效果是白底黑字,而且字体极小,看着特别费劲,对终端做些设置让其使用起来更舒服些。

文章图片
#macos#chrome
    共 15 条
  • 1
  • 2
  • 请选择