基准测试:PostgreSQL 上的 bigint 与 int

Postgredaxiang

208人浏览 · 2022-09-03 07:52:07

Postgredaxiang · 2022-09-03 07:52:07 发布

问题:基准测试:PostgreSQL 上的 bigint 与 int

我想提高我的数据库性能。在一个项目中,所有表都从int变为bigint,我认为这不仅在存储方面是一个糟糕的选择,因为int需要4 bytes,而bigint需要8 bytes;而且在性能方面也是如此。所以我创建了一个带有1000万条目的小表,脚本在Python:

import uuid

rows=10000000

output='insert_description_bigint.sql'
f = open(output, 'w')

set_schema="SET search_path = norma;\n"
f.write(set_schema)

for i in range(1,rows):
    random_string=uuid.uuid4()
    query="insert into description_bigint (description_id, description) values (%d, '%s'); \n"
    f.write(query % (i,random_string))

这就是我创建two表的方式:

-- BIGINT

DROP TABLE IF EXISTS description_bigint;

CREATE TABLE description_bigint
(
  description_id BIGINT PRIMARY KEY NOT NULL,
  description VARCHAR(200),
  constraint description_id_positive CHECK (description_id >= 0)
);

select count(1) from description_bigint;
select * from description_bigint;
select * from description_bigint where description_id = 9999999;

-- INT

DROP TABLE IF EXISTS description_int;

CREATE TABLE description_int
(
  description_id INT PRIMARY KEY NOT NULL,
  description VARCHAR(200),
  constraint description_id_positive CHECK (description_id >= 0)
);

插入所有这些数据后,我对这两个表进行查询,以测量它们之间的差异。令我惊讶的是,它们都具有相同的性能:

select * from description_bigint; -- 11m55s
select * from description_int; -- 11m55s

我的基准测试有问题吗?int不应该比bigint快吗?特别是,当primary key被定义为index时,这意味着,为bigint创建索引将比为int创建索引慢**,具有相同的数据量,对吧?

我知道这不仅仅是一件会对我的数据库性能产生巨大影响的小事,而且我想确保我们使用最佳实践并在这里专注于性能。

解答

在 64 位系统中,这两个表几乎相同。description_int中的description_id列包含 8 个字节(4 个用于整数,4 个用于对齐)。试试这个测试:

select 
    pg_relation_size('description_int')/10000000 as table_int, 
    pg_relation_size('description_bigint')/10000000 as table_bigint,
    pg_relation_size('description_int_pkey')/10000000 as index_int,
    pg_relation_size('description_bigint_pkey')/10000000 as index_bigint;

两个表的平均行大小几乎相同。这是因为整数列占用 8 个字节(一个值 4 个字节,对齐 4 个字节)与 bigint (一个没有填充符的值 8 个字节)完全一样。这同样适用于索引条目。然而,这是一种特殊情况。如果我们在第一个表中再添加一个整数列:

CREATE TABLE two_integers
(
  description_id INT PRIMARY KEY NOT NULL,
  one_more_int INT,
  description VARCHAR(200),
  constraint description_id_positive CHECK (description_id >= 0)
);

平均行大小应该保持不变,因为前 8 个字节将用于两个整数(没有填充符)。

在在 PostgreSQL 中计算和节省空间中找到更多详细信息。

PostgreSQL

PostgreSQL社区为您提供最前沿的新闻资讯和知识内容

更多推荐

PostgreSQL 计数查询效率,物化视图 [重复]

问题:PostgreSQL 计数查询效率,物化视图 [重复] 可能重复: PostgreSQL 计数查询优化使用 PostgreSQL 9.2,我们试图弄清楚是否有一种方法可以跟踪查询的结果数量,并以有效的方式返回该数字。这个查询应该每秒执行几次(可能几十到几百甚至几千次)。我们现在的查询看起来像这样,但我们想知道这是否效率低下: -- Get # of rows that do not hav

PostgreSQL

多对多中的唯一性

问题:多对多中的唯一性我无法弄清楚谷歌的哪些术语,所以帮助标记这个问题或只是以相关问题的方式向我指出会有所帮助。我相信我有一个典型的多对多关系: CREATE TABLE groups ( id integer PRIMARY KEY); CREATE TABLE elements ( id integer PRIMARY KEY); CREATE TABLE groups_elements

PostgreSQL

Django 与 postgresql - manage.py syncdb 返回错误

问题:Django 与 postgresql - manage.py syncdb 返回错误我从 Django 开始。我设置了一些使用 SQLite 工作的站点,但是在将 DB 引擎更改为 postgresql manage.py syncdb 后返回错误。我已经用谷歌搜索了 2 天,但对我仍然没有任何作用。Postgres 用户 'joe' 具有超级用户权限和本地 'joe ' 数据库存在。