Xzx. 个人主页

@xzx8500

Xzx.

2025-12-02 22:39:00 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

04-基于Embedding的相似搜索

本文介绍了使用智谱AI的Embedding技术进行文本相似搜索的实现方法。通过读取存储文本向量的CSV文件，将字符串格式的向量转换为可计算的Python列表。文章详细说明了调用智谱AI的embedding接口将文本转换为高维向量，以及计算余弦相似度的函数实现。最后演示了如何根据关键词在向量空间中进行相似搜索，并返回相似度最高的结果。该方法可应用于文本检索、推荐系统等场景，通过向量相似度快速找到相关

#c##开发语言

1.使用LangChain调用LLM

第二个model用的是智谱的GLM-4，是免费，适合初学者一开始学习，第一个是用的DeepSeek的，兼容的OpenAi，需要付费。

#java #数据库

06-FAISS向量数据库

1.安装FAISSpip install faiss-cpu，也可以是gpu，看具体使用情况2.实现代码输出：左边的文件栏也会出现保存的数据库：输出：

#faiss #python #开发语言

05-Qwen3的嵌入模型和langchain的整合

【代码】Qwen3的嵌入模型和langchain的整合。

#python

LangGraph-智能体中Tool的定义

这个@tool装饰器是定义自定义工具的最简单方法。默认情况下，装饰器使用函数名称作为工具名称，但可以通过将字符串作为第一个参数传递来覆盖。此外，装饰器将使用函数的文档字符串作为工具的描述 - 因此必须提供文档字符串。请注意，@tool支持解析注释、嵌套模式和其他特性，有几种常见的方法，此次列举几种常见的方法。

#python

07-上下文感知的RAG案例

1.从指定网页加载 Agent 相关知识并构建向量数据库；3.结合聊天历史理解用户问题（比如处理指代 / 省略）；4.生成简洁、基于上下文的回答，并保留会话历史。2.基于用户问题从向量库检索相关上下文；

#python

01-Qwen3大模型私有化部署-租赁算力云上部署

由于电脑配置问题，选择了租用算力云进行部署，，选择RTX 4090的显卡进行配置，具体配置看下图，如果部署vllm的时候可能出现版本不兼容，可以尝试更换显卡，如4090D换成4090。

#人工智能

LangChain简介

Langchain 是一个开源的AI框架，可以提升大模型的功能性，它允许开发人员将像 GPT-4 这样的大型语言模型与外部的计算和数据源结合起来，并且产生交互，比如让模型从你的私有数据中提取信息类似数据库、PDF文件或其他文档，甚至Langchain 还可以帮助你根据这些信息执行特定操作，如发送邮件；这些主要依靠其为开发者提供者提供的多种模块化组件，便于使用的同时，也使得LLM获得更为准确和详细的

Agent的上下文和记忆

配置适用于不可变数据，如用户元数据或 API 密钥。当您有在运行期间不会更改的值时使用。使用保留用于此目的的键。1.运行时传入的信息，如 `user_id` 或 API 凭据。这里工具和graph.py是彼此分开两个.py文件的。2.多步推理过程中更新的内部状态。3.来自先前交互的持久记忆或事实。数据，这些数据可以影响代理行为或工具执行。LangGraph 提供了。上下文包括消息列表之外的。在te

#python

LangGraph-智能体中Tool的定义

#python

共 11 条

请选择