logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【大白话 AI 答疑】 第7篇熵、交叉熵与交叉熵损失的概念梳理及计算示例

熵是信息论中的核心概念,由香农(Shannon)提出,用于衡量一个随机变量取值的不确定性程度。简单来说,熵值越高,随机变量的不确定性就越大;熵值越低,不确定性就越小。当随机变量的取值确定无疑时(比如必然发生的事件),熵值为0;当随机变量所有取值的概率均等时,熵值达到最大。对于离散型随机变量X,其可能的取值为x₁, x₂, …, xₙ,对应的概率分布为P(X=xᵢ) = pᵢ(其中i=1,2,…

#人工智能#概率论#机器学习
【大白话 AI 答疑】第3篇 面试必背:自回归模型定义 + GPT 的自回归特性(附对比表)

自回归模型是基于历史信息逐元素生成序列的模型,核心特点是时序依赖和串行生成。GPT是典型的自回归模型,采用Transformer解码器架构,通过掩码自注意力机制确保生成每个token时仅依赖前面内容。与非自回归模型相比,GPT生成更连贯但速度较慢。这种设计使GPT能生成逻辑清晰的长文本,成为优秀对话和创作模型的基础。

#人工智能#回归
【GPT入门】第26课 掌握langchain LCEL 链式调用的三种方法

_call__语法:最常用,调用方式简洁直观,适用于单个输入的情况。invoke方法:和直接调用链对象功能类似,在某些场景下可能更具灵活性。apply方法:用于批量处理多个输入,能提高处理效率。

为什么用 hf download 下载的模型比 AutoModelForCausalLM.from_pretrained 加载的大很多?

下载的是模型仓库的完整原始文件集(包含所有格式、分片和冗余内容),而仅加载必要的、经过优化处理的文件(如适配精度、合并分片),因此前者的文件总大小会显著大于后者。如果需要控制下载大小,可以在中指定精度参数(如),或通过手动筛选所需文件(如仅下载特定分片和配置文件)。

【GPT入门】第11课 FunctionCall调用本地代码入门

为了了解,funcationCall底层,手写一个functionCall多方法,并调用,体验。2.让大模型自动识别用户问题,解释参数,获取调用方法id、方法名称、方法参数。3.把第二步的结果,给大模型,让大模型调用函数,并返回结果。任务:让openai调用sum方法,对加法进行求和。1.定义sum方法,给openAi接口。

文章图片
#java
【GPT入门】第26课 掌握langchain LCEL 链式调用的三种方法

_call__语法:最常用,调用方式简洁直观,适用于单个输入的情况。invoke方法:和直接调用链对象功能类似,在某些场景下可能更具灵活性。apply方法:用于批量处理多个输入,能提高处理效率。

apache源码 学以致用 第二课: 跟kafka学习 程序优雅退出

程序运行后,需要做资源清理,删除目录、关闭数据库连接等,本文学习kafka,顶级大师的代码,看看怎样把本领学到手。在main方法中增加Runtime.getRuntime().addShutdownHook(new Thread()) 来实现资源的清理

#kafka
实践数据湖iceberg 第九课 合并小文件

系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言1. 合并小文件二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习

#kafka#hive#big data
实践数据湖iceberg 第十一课 测试分区表完整流程(造数、建表、合并、删快照)

系列文章目录实践数据湖iceberg 第一课 入门实践数据湖iceberg 第二课 iceberg基于hadoop的底层数据格式实践数据湖iceberg 第三课 在sqlclient中,以sql方式从kafka读数据到iceberg实践数据湖iceberg 第四课 在sqlclient中,以sql方式从kafka读数据到iceberg(升级版本到flink1.12.7)实践数据湖iceberg 第

#big data
到底了