大模型学习入门-术语解释
prompt:提示词,就是你跟大模型说的每一句话
system prompt: 系统提示词,你给大模型设定的需要遵守的约定
token: 分词器把prompt切分成一个一个token,token是大模型理解内容的最小单元,每个token都对应着一个数字(token id),大模型的任务就是算出在这串token序列后,应当续写哪些token
上下文(窗口):大模型能获取到的对话范围
幻觉:大模型会乱说话,大模型本质是一个不断续写token的机器,你给它上文,它根据自己学过的概率,去猜下一个最合适的词是什么,猜完一个再猜下一个,最终形成一段话。但是这个只保证了语言流畅不能保证事实正确,所以有时候大模型会出现一本正经地胡说八道的情况。
Structured Output:结构化输出,按照设定规则输出,比如要求模型按照json的格式输出结果、按照表格的格式输出结果
Function Calling:函数调用,可以按照设定的规则调用对应的函数
RAG:检索增强生成,让模型基于知识库去回答,会将文档存到向量数据库便于,模型检索相关知识
Embedding: 将文档块转化为向量的工具
向量数据库:向量的存储引擎,便于检索时按照向量查找对应内容
微调:用数据训练模型,让模型学会一种固定的风格、逻辑或特定领域的常识。
Agent:给agent一个目标,agent会自己拆解目标化为行动,agent其实就很像助手,它能自己独立完成很多事情,最后给到一个结果
MCP:模型上下文协议,即工具对接的“USB协议”,大模型在调用MCP时要根据MCP工具给出的标准格式给出对应的参数,与函数调用不同的是,函数调用只是给出了工具,而在大模型中如何使用这个函数是需要我们自己用json格式来说明的,mcp则不用写对应的使用说明,因为mcp已经将规则制定好了
Skill:Skill 是封装好的能力模块,包括知识库、工具集、提示词等信息,当Agent判断用户意图是属于某个能力模块时,会激活相关的Skill,这个 Skill 瞬间将上述三样东西加载到上下文中,让大模型暂时变成这个领域的专家。
注意:自用笔记,仅供参考,如有错误,欢迎指正!
更多推荐



所有评论(0)