logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

调用大模型进行推理时,为什么output.outputs[0].text可以提取我们想要的模型输出结果?(自用版)

文章解释了在调用语言模型时常见的代码片段gen_text=output.outputs[0].text的含义。该代码用于从模型返回结果中提取文本内容,获取模型生成的主要文本输出。

文章图片
#人工智能
保姆级解析!Attention Weights 和 Attention是啥?到底怎么算?

本文介绍了注意力机制(Attention)的核心概念与计算过程。首先解释了如何通过Embedding将词语转换为向量表示,然后详细说明了查询(Q)、键(K)、值(V)三个向量的获取方式。重点讲解了Self-Attention的计算流程:通过Q与K计算得分(score),经softmax归一化得到注意力权重(Attention Weights),最后加权求和V得到注意力输出(Attention)。帮

文章图片
#人工智能#transformer
到底了