*星星之火* 个人主页

@spark_dev

*星星之火*

2022-09-29 17:29:03 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

实践数据湖iceberg 第八课 hive与iceberg集成

系列文章目录实践数据湖iceberg 第一课实践数据湖iceberg 第二课 iceberg基于hadoop的底层数据格式实践数据湖iceberg 第三课在sqlclient中，以sql方式从kafka读数据到iceberg实践数据湖iceberg 第四课在sqlclient中，以sql方式从kafka读数据到iceberg（升级版本到flink1.12.7）实践数据湖iceberg 第五课

#hive #kafka #big data

【GPT入门】第26课掌握langchain LCEL 链式调用的三种方法

_call__语法：最常用，调用方式简洁直观，适用于单个输入的情况。invoke方法：和直接调用链对象功能类似，在某些场景下可能更具灵活性。apply方法：用于批量处理多个输入，能提高处理效率。

【第37课】一文读懂！RAG 评估中忠实性与答案相关性的本质差异

在RAG（检索增强生成）评估中，忠实性和答案相关性是两个不同但又相互关联的重要指标，它们的区别如下：

【GPT入门】第11课 FunctionCall调用本地代码入门

为了了解，funcationCall底层，手写一个functionCall多方法，并调用，体验。2.让大模型自动识别用户问题，解释参数，获取调用方法id、方法名称、方法参数。3.把第二步的结果，给大模型，让大模型调用函数，并返回结果。任务：让openai调用sum方法，对加法进行求和。1.定义sum方法，给openAi接口。

#java

【GPT入门】第20课 langchain的function calling 初步体验

query = “3 加 4的和的 5 倍是多少？”这个会调用两次函数。query = " 4的 5 倍是多少？

#python

为什么用 hf download 下载的模型比 AutoModelForCausalLM.from_pretrained 加载的大很多？

下载的是模型仓库的完整原始文件集（包含所有格式、分片和冗余内容），而仅加载必要的、经过优化处理的文件（如适配精度、合并分片），因此前者的文件总大小会显著大于后者。如果需要控制下载大小，可以在中指定精度参数（如），或通过手动筛选所需文件（如仅下载特定分片和配置文件）。

【大白话 AI 答疑】第8篇 BERT与传统机器学习（如贝叶斯）在文本分类中的区别及效果对比

核心结论：。

#人工智能 #机器学习 #bert

【大白话 AI 答疑】第7篇熵、交叉熵与交叉熵损失的概念梳理及计算示例

熵是信息论中的核心概念，由香农（Shannon）提出，用于衡量一个随机变量取值的不确定性程度。简单来说，熵值越高，随机变量的不确定性就越大；熵值越低，不确定性就越小。当随机变量的取值确定无疑时（比如必然发生的事件），熵值为0；当随机变量所有取值的概率均等时，熵值达到最大。对于离散型随机变量X，其可能的取值为x₁, x₂, …, xₙ，对应的概率分布为P(X=xᵢ) = pᵢ（其中i=1,2,…

#人工智能 #概率论 #机器学习

【大白话 AI 答疑】第3篇面试必背：自回归模型定义 + GPT 的自回归特性（附对比表）

自回归模型是基于历史信息逐元素生成序列的模型，核心特点是时序依赖和串行生成。GPT是典型的自回归模型，采用Transformer解码器架构，通过掩码自注意力机制确保生成每个token时仅依赖前面内容。与非自回归模型相比，GPT生成更连贯但速度较慢。这种设计使GPT能生成逻辑清晰的长文本，成为优秀对话和创作模型的基础。

#人工智能 #回归

【GPT入门】第26课掌握langchain LCEL 链式调用的三种方法

共 15 条

请选择