logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

04-基于Embedding的相似搜索

本文介绍了使用智谱AI的Embedding技术进行文本相似搜索的实现方法。通过读取存储文本向量的CSV文件,将字符串格式的向量转换为可计算的Python列表。文章详细说明了调用智谱AI的embedding接口将文本转换为高维向量,以及计算余弦相似度的函数实现。最后演示了如何根据关键词在向量空间中进行相似搜索,并返回相似度最高的结果。该方法可应用于文本检索、推荐系统等场景,通过向量相似度快速找到相关

#c##开发语言
1.使用LangChain调用LLM

第二个model用的是智谱的GLM-4,是免费,适合初学者一开始学习,第一个是用的DeepSeek的,兼容的OpenAi,需要付费。

#java#数据库
06-FAISS向量数据库

1.安装FAISSpip install faiss-cpu,也可以是gpu,看具体使用情况2.实现代码输出:左边的文件栏也会出现保存的数据库:输出:

#faiss#python#开发语言
05-Qwen3的嵌入模型和langchain的整合

【代码】Qwen3的嵌入模型和langchain的整合。

#python
LangGraph-智能体中Tool的定义

这个@tool装饰器是定义自定义工具的最简单方法。默认情况下,装饰器使用函数名称作为工具名称,但可以通过将字符串作为第一个参数传递来覆盖。此外,装饰器将使用函数的文档字符串作为工具的描述 - 因此必须提供文档字符串。请注意,@tool支持解析注释、嵌套模式和其他特性,有几种常见的方法,此次列举几种常见的方法。

#python
07-上下文感知的RAG案例

1.从指定网页加载 Agent 相关知识并构建向量数据库;3.结合聊天历史理解用户问题(比如处理指代 / 省略);4.生成简洁、基于上下文的回答,并保留会话历史。2.基于用户问题从向量库检索相关上下文;

#python
01-Qwen3大模型私有化部署-租赁算力云上部署

由于电脑配置问题,选择了租用算力云进行部署,,选择RTX 4090的显卡进行配置,具体配置看下图,如果部署vllm的时候可能出现版本不兼容,可以尝试更换显卡,如4090D换成4090。

#人工智能
LangChain简介

Langchain 是一个开源的AI框架,可以提升大模型的功能性,它允许开发人员将像 GPT-4 这样的大型语言模型与外部的计算和数据源结合起来,并且产生交互,比如让模型从你的私有数据中提取信息类似数据库、PDF文件或其他文档,甚至Langchain 还可以帮助你根据这些信息执行特定操作,如发送邮件;这些主要依靠其为开发者提供者提供的多种模块化组件,便于使用的同时,也使得LLM获得更为准确和详细的

文章图片
Agent的上下文和记忆

配置适用于不可变数据,如用户元数据或 API 密钥。当您有在运行期间不会更改的值时使用。使用保留用于此目的的键。1.运行时传入的信息,如 `user_id` 或 API 凭据。这里工具和graph.py是彼此分开两个.py文件的。2.多步推理过程中更新的内部状态。3.来自先前交互的持久记忆或事实。数据,这些数据可以影响代理行为或工具执行。LangGraph 提供了。上下文包括消息列表之外的。在te

#python
LangGraph-智能体中Tool的定义

这个@tool装饰器是定义自定义工具的最简单方法。默认情况下,装饰器使用函数名称作为工具名称,但可以通过将字符串作为第一个参数传递来覆盖。此外,装饰器将使用函数的文档字符串作为工具的描述 - 因此必须提供文档字符串。请注意,@tool支持解析注释、嵌套模式和其他特性,有几种常见的方法,此次列举几种常见的方法。

#python
    共 11 条
  • 1
  • 2
  • 请选择