logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

SemanticSplitterNodeParser 和 Sentence-BERT 的区别和联系是什么

确实,Sentence-BERT 本身并不负责切割文本,它的职责仅限于:✅ 将句子或段落转成语义向量(embedding)也就是说:它不会判断“在哪切”;它不会负责实际的文本切分逻辑;它只是一个“编码器”或者“翻译器”,把自然语言翻成高维向量。

文章图片
#bert#人工智能#深度学习
利用 LangChain 和一个大语言模型(LLM)构建一个链条,自动从用户输入的问题中提取相关的 SQL 表信息,再生成对应的 SQL 查询

实现一个智能化的数据查询过程:输入: 用户问题(如关于 Alanis Morisette 歌曲的查询)。内部处理:利用 LLM 提取相关 SQL 表类别。根据类别映射出具体的 SQL 表名称。结合数据库的表结构和预定义的 SQL 提示模板,生成正确的 SQL 查询语句。输出: 一条 SQL 查询语句,用来从数据库中获取答案。

文章图片
#语言模型#sql#人工智能
在大语言模型(LLM)中调用(Function Calling) 自定义的结构化函数

**函数调用(Function Calling)** 指的是**大语言模型(LLM)自动调用我们定义的结构化函数 ,比如这里的`RouteQuery`**,它的作用是根据输入的问题内容,返回对应的数据类别(`python_docs`、`js_docs` 或 `golang_docs`)。

文章图片
#人工智能#python#开发语言 +1
OpenAI Embedding 和密集检索(如 BERT/DPR)进行语义相似度搜索有什么区别和联系

把文本(问题、文档)转成高维向量用**向量相似度(如余弦、内积)**来进行匹配,而不是关键词匹配对比点密集检索(BERT/DPR)OpenAI Embedding 检索属于什么都属于 Dense Retrieval本质做什么都是文本→向量→向量相似度匹配区别使用的模型来源不同(开源 vs 商业 API)联系可以完全互换,流程一致,只是底层模型不同。

文章图片
#bert#人工智能
VectorMemory、VectorStoreIndex 和持久化存储的关系

的职责是索引和查询,它不会直接负责持久化操作。持久化是由FAISS 或 Chroma等底层库通过显式的持久化方法(如)来实现的。

文章图片
#数据库
PydanticToolsParser 工具(tool call)把 LLM 生成的文本转成结构化的数据(Pydantic 模型)过程中遇到的坑

PydanticToolsParser 的作用PydanticToolsParser 是一个工具,主要作用是 把 LLM 生成的文本转成结构化的数据(Pydantic 模型),让代码更容易使用这些数据进行自动化处理。换句话说,AI 生成的文本通常是自然语言,代码不好直接解析,比如 "请帮我订明天上午 10 点到上海的机票"。如果用 PydanticToolsParser,就可以把这句话解析成一个

文章图片
#python#人工智能
用于与多个数据库聊天的智能 SQL 代理问答和 RAG 系统(1) —— 使用 LangChain 中的 TavilySearchResults 类创建一个搜索工具

使用 LangChain 中的 TavilySearchResults 类创建一个搜索工具实例,并尝试执行一个搜索任务。

文章图片
#数据库#sql
Milvus中 Collections 级多租户 和 分区级多租户 的区别

摘要:本文探讨了Milvus向量数据库中实现多租户RAG的三种方案:1)所有租户共享一个Collection并用字段过滤;2)每个租户使用独立分区;3)基于Partition Key的自动分区方案。这三种方案虽然在结构上都通过租户ID区分数据,但在性能、隔离性、可扩展性等方面存在本质差异。文章详细比较了各方案的优缺点,指出字段过滤属于后过滤机制,而分区方案通过预过滤能显著提升性能。其中,Parti

#milvus
使用 SQL 和表格数据进行问答和 RAG(3)— 使用 LangChain 和 SQL 数据库构建一个可以通过自然语言询问数据库问题的流水线(Pipeline)

使用 LangChain 和 SQL 数据库构建一个可以通过自然语言询问数据库问题的流水线(Pipeline)。以下是代码的逐步解析和示例结果说明:从代码来看,你正在使用 LangChain 和 SQL 数据库构建一个可以通过自然语言询问数据库问题的流水线(Pipeline)。以下是代码的逐步解析和示例结果说明::使用 OpenAI 的模型(如 GPT-4)。 确保输出更稳定、确定。环境变量::A

文章图片
#数据库#sql
LangGraph 在不同的 stream_mode 下返回的东西并不一样

本文解释了LangGraph中不同流式模式(stream_mode)下返回数据结构的差异。当使用stream_mode="messages"时,返回的是LLM原始消息对象(如AIMessage),不会包含自定义的joke字段;而stream_mode="values"则会返回状态更新字典。通过代码示例验证:return {"joke":.

#python
    共 129 条
  • 1
  • 2
  • 3
  • 13
  • 请选择