logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型笔记_大模型不是靠记忆回答问题

注:下述问题答案是基于大模型回答这是一个非常有趣的问题!大模型(如 GPT、BERT 等)在回答类似“中国的首都在哪里”这样的问题时,并不是像人类一样单纯依靠记忆,而是通过其训练过程和工作机制来生成答案。大模型的回答并不是直接从一个“知识库”中提取信息,而是基于其训练数据中的模式和规律生成答案。

大模型笔记_常见术语

本文系统整理了AI领域的核心术语与概念,涵盖基础概念、模型架构、注意力机制、训练方法等8大类别。重点包括:基础概念如AI、AGI、LLM;模型架构如Transformer、GPT、BERT;训练方法如预训练、微调、RLHF;以及评估指标和推理优化技术。这些术语构成了当前AI研究与应用的技术框架,反映了从基础理论到前沿方法的发展脉络。文章以结构化方式呈现术语全称、中文翻译及简明定义,为读者提供了一份

#语言模型
大模型笔记_大模型是如何理解输入信息的

注意:下述内容整理自大模型回答内容。好的!让我用简单易懂的语言来解释一下大模型是如何理解你输入的信息,以及它是怎么找到关键信息的。大模型就像一个超级聪明的“语言翻译器”,但它并不是真的像人一样“看懂”文字。

大模型笔记_token概念

注: 下述内容整理自大模型回答。提问:请用一个15岁中学生能听懂的语言,介绍下大模型术语 token好的!让我用简单易懂的语言来解释一下 Token 是什么。你可以把 Token 想象成是组成语言的一块块小积木。当我们用电脑处理文字时,电脑并不能直接理解整个句子或段落,它需要把文字拆成更小的部分,这些部分就是 Token。所以,Token 就像是电脑用来理解语言的基本单位。虽然有时候一个 Toke

大模型笔记-“训练”和“推理”概念

在大模型的资源管理和开发流程中,训练和推理是两个核心阶段。训练是模型通过大量数据和计算资源学习数据规律的过程,需要高性能GPU集群和长时间计算,目标是生成模型权重参数。推理则是将训练好的模型应用于实际场景,对新数据进行预测或生成结果,要求高效和低成本,通常使用单卡GPU或专用推理芯片。

Kotlin: [Internal Error] java.lang.NoSuchFieldError: FILE_HASHING_STRATEGY

摘要:编译Maven应用时出现Kotlin报错"FILE_HASHING_STRATEGY",初步判断是Kotlin版本过低导致。参考解决方案配置KotlinCompiler版本后,又出现新错误"Unknown -Xjvm-default mode:enable"。该错误是由于新版本Kotlin编译器已废弃"-Xjvm-default=enable

#java#kotlin
大模型笔记_常见术语

本文系统整理了AI领域的核心术语与概念,涵盖基础概念、模型架构、注意力机制、训练方法等8大类别。重点包括:基础概念如AI、AGI、LLM;模型架构如Transformer、GPT、BERT;训练方法如预训练、微调、RLHF;以及评估指标和推理优化技术。这些术语构成了当前AI研究与应用的技术框架,反映了从基础理论到前沿方法的发展脉络。文章以结构化方式呈现术语全称、中文翻译及简明定义,为读者提供了一份

#语言模型
大模型笔记_token概念

注: 下述内容整理自大模型回答。提问:请用一个15岁中学生能听懂的语言,介绍下大模型术语 token好的!让我用简单易懂的语言来解释一下 Token 是什么。你可以把 Token 想象成是组成语言的一块块小积木。当我们用电脑处理文字时,电脑并不能直接理解整个句子或段落,它需要把文字拆成更小的部分,这些部分就是 Token。所以,Token 就像是电脑用来理解语言的基本单位。虽然有时候一个 Toke

设计模式笔记_行为型_访问者模式

访问者模式是一种行为设计模式,允许在不修改对象结构的情况下定义新操作。该模式将操作逻辑与对象结构分离,通过Visitor接口定义操作,由具体访问者(如ArtLoverVisitor)实现不同行为。被访问对象(如Painting)实现Element接口的accept方法,接受访问者访问。ObjectStructure(如Museum)管理元素集合并提供遍历访问的接口。优点是新增操作方便、符合单一职责

#设计模式#访问者模式
python uniform 函数

python的 uniform 函数

#python
    共 18 条
  • 1
  • 2
  • 请选择