向量数据库
如上图所示:
其中开源的向量数据库有,chroma,milvus,lanceDB等
商用的向量数据库有,pinecone和weaciate
其中可以实现向量搜索的数据库有,postgreSQL,openSearch等

向量数据库是专门用于存储和处理高维数据的数据库

向量:是一组描述和表示对象各种特征的数值这些
每个向量代表一个单独的数据点,例如一个词或一张图片,并且由描述其许多特性的值的集合组成。变量被称为特征或维度

向量数据的产生:
一般通过深度学习等技术产生的高维矢量(embedding model)

查询方式:
矢量数据库,通过索引算法,根据查询向量和向量的相似度,来搜索和检索向量。相似性搜索的有效性取决于所选的距离度量,常用指标包括欧式距离 和 余弦相似度,每个都适用不同的向量分布
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

矢量数据库的用法:

  1. 推荐商品,根据购买过的商品和浏览过的商品,推荐用户感兴趣的商品
  2. AI使用
  3. 矢量数据库+模型,构建外挂知识库
    1.将内容通过嵌入模型转为矢量嵌入,并保存到矢量数据库中(并且能够通过矢量找到对应的原始内容)
    2.用户提问时,嵌入模型就是将问题转为矢量嵌入,并且通过矢量数据库,检索相似的矢量
Logo

瓜分20万奖金 获得内推名额 丰厚实物奖励 易参与易上手

更多推荐