向量数据库介绍
矢量数据库,通过索引算法,根据查询向量和向量的相似度,来搜索和检索向量。相似性搜索的有效性取决于所选的距离度量,常用指标包括欧式距离和余弦相似度,每个都适用不同的向量分布。每个向量代表一个单独的数据点,例如一个词或一张图片,并且由描述其许多特性的值的集合组成。变量被称为特征或维度。其中可以实现向量搜索的数据库有,postgreSQL,openSearch等。其中开源的向量数据库有,chroma,m
·
如上图所示:
其中开源的向量数据库有,chroma,milvus,lanceDB等
商用的向量数据库有,pinecone和weaciate
其中可以实现向量搜索的数据库有,postgreSQL,openSearch等
向量数据库是专门用于存储和处理高维数据的数据库
向量:是一组描述和表示对象各种特征的数值这些
每个向量代表一个单独的数据点,例如一个词或一张图片,并且由描述其许多特性的值的集合组成。变量被称为特征或维度
向量数据的产生:
一般通过深度学习等技术产生的高维矢量(embedding model)
查询方式:
矢量数据库,通过索引算法,根据查询向量和向量的相似度,来搜索和检索向量。相似性搜索的有效性取决于所选的距离度量,常用指标包括欧式距离 和 余弦相似度,每个都适用不同的向量分布
矢量数据库的用法:
- 推荐商品,根据购买过的商品和浏览过的商品,推荐用户感兴趣的商品
- AI使用
- 矢量数据库+模型,构建外挂知识库
1.将内容通过嵌入模型转为矢量嵌入,并保存到矢量数据库中(并且能够通过矢量找到对应的原始内容)
2.用户提问时,嵌入模型就是将问题转为矢量嵌入,并且通过矢量数据库,检索相似的矢量
更多推荐
已为社区贡献2条内容
所有评论(0)