问题:结合 MySQL、Sphinx 和 MongoDB。好主意?

对于一个新项目,我希望将 MySQL、Sphinx 和 MongoDB 结合起来。 MySQL 用于关系数据和数值搜索,Sphinx 用于自由文本搜索,MongoDB 用于地理数据。就我的(快速)基准测试而言,MongoDB 是地理查询速度最快的,sphinx 是自由文本搜索速度最快的,MySQL 是关系数据搜索速度最快的。因此,为了获得最佳性能,我可能必须将它们结合到我的项目中。

然而,这有三个缺点。

1.三点故障,即Sphinx、MySQL和MongoDB可能会崩溃,这将停止我的网站

  1. 我需要三个数据库中的数据,并且需要使它们保持最新(所有数据每天只更改一个,所以这不是最糟糕的问题)。

  2. 硬件要求,主要是 RAM,因为所有数据库都希望有很大一部分 RAM 能够执行。

所以问题是我应该将这三个结合起来,留下一个(可能是 MongoDB 并使用 Sphinx 进行地理数据)还是只使用一个(MongoDB 或 MySQL)?

为了了解数据,关系数据约为 6GB,地理数据约为 4GB,自由文本数据约为 16GB。

解答

不太了解 3 个数据库中包含的记录/集合/文档是否具有数据库间引用。 EG 如果用户名、工作、电话号码在 Mysql 中,用户地址在 Mongo 中。我假设答案是肯定的。

恕我直言,不建议使用 3 种不同的存储解决方案,因为:

1)(最重要)您不能聚合来自 2 个数据库的数据(以可扩展的方式)。

示例:假设您将用户数据(用户名)保存在 Mysql 中,并将用户地理坐标保存在 Mongo 中。您无法查询对两个数据库上的字段进行过滤/排序。例如,您不能:

SELECT all users 
WHERE name starts with 'A'
SORT BY distance_from_center

同样适用于狮身人面像。

解决方案:您要么限制在单个数据库上可用的数据,要么将数据从一个数据库复制/镜像到另一个数据库。

2)维护成本:要维护3台服务器,不同的备份/冗余策略,不同的扩展策略;开发成本:开发者必须使用 3 个查询库,3 种不同的查询方式等。

3)必须手动处理的不一致/同步问题(EG你想在mongo和mysql中都插入数据;假设mongo写了数据,但是mysql引发了引用完整性异常,所以现在你有dbs之间的不一致)

4)关于硬件成本,唯一的内存消耗者是 MongoDB(建议它必须在 ram 中拥有所有索引)。对于 MySQL 和 Solr 服务器,您可以控制内存消耗。

我会做什么:

  • 如果我不需要所有 SQL 功能(如事务、参照完整性、连接等),我会选择 Mongo

  • 如果我需要这些功能,并且我可以忍受较低的地理操作性能,我会选择 MySQL

  • 现在,如果我需要(我的意思是,我真的需要)全文搜索,而 Mongo/Mysql FTS 功能还不够,我还会附加一个 FTS 服务器,如 Sphinx、Solr、Elasticsearch 等

Logo

MongoDB社区为您提供最前沿的新闻资讯和知识内容

更多推荐