logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型笔记-“训练”和“推理”概念

在大模型的资源管理和开发流程中,训练和推理是两个核心阶段。训练是模型通过大量数据和计算资源学习数据规律的过程,需要高性能GPU集群和长时间计算,目标是生成模型权重参数。推理则是将训练好的模型应用于实际场景,对新数据进行预测或生成结果,要求高效和低成本,通常使用单卡GPU或专用推理芯片。

大模型笔记_token概念

注: 下述内容整理自大模型回答。提问:请用一个15岁中学生能听懂的语言,介绍下大模型术语 token好的!让我用简单易懂的语言来解释一下 Token 是什么。你可以把 Token 想象成是组成语言的一块块小积木。当我们用电脑处理文字时,电脑并不能直接理解整个句子或段落,它需要把文字拆成更小的部分,这些部分就是 Token。所以,Token 就像是电脑用来理解语言的基本单位。虽然有时候一个 Toke

设计模式笔记_行为型_访问者模式

访问者模式是一种行为设计模式,允许在不修改对象结构的情况下定义新操作。该模式将操作逻辑与对象结构分离,通过Visitor接口定义操作,由具体访问者(如ArtLoverVisitor)实现不同行为。被访问对象(如Painting)实现Element接口的accept方法,接受访问者访问。ObjectStructure(如Museum)管理元素集合并提供遍历访问的接口。优点是新增操作方便、符合单一职责

#设计模式#访问者模式
python uniform 函数

python的 uniform 函数

#python
pkl文件,csv文件,tsv文件

pkl文件,csv文件,tsv文件

#python
ROC曲线与AUC计算-笔记

介绍ROC和AUC相关内容

文章图片
Mac终端配置-笔记

mac终端默认显示效果是白底黑字,而且字体极小,看着特别费劲,对终端做些设置让其使用起来更舒服些。

文章图片
#macos#chrome
Servlet容器(Web容器)简介-笔记

Servlet 是 Server Applet 的缩写,译为“服务器端小程序”,是一种使用 Java 语言来开发动态网站的技术。Servlet 虽然被称作“小程序”,但是它的功能却异常强大,因为它是基于 Java 的,几乎可以使用所有的 Java API,Java 能做的事情,Servlet 也能做。

文章图片
#java#tomcat
python numpy库中flatten()函数用法

python的numpy库中flatten()函数用法

#python#numpy
    共 12 条
  • 1
  • 2
  • 请选择