如何在 PostgreSQL 9.4+ 中将简单的 json(b) int 数组转换为 integer[]

Postgredaxiang

168人浏览 · 2022-09-26 01:32:29

Postgredaxiang · 2022-09-26 01:32:29 发布

问题:如何在 PostgreSQL 9.4+ 中将简单的 json(b) int 数组转换为 integer[]

我有一个来自 json 对象的数组:[1, 9, 12]

由于它使用方括号表示法,因为它是直接从 json 对象中获取的,所以我无法将其转换为::integer[],当我尝试使用array_agg(jsonb_array_elements(simpleintarray))时,我收到一条错误消息,提示我需要按 id 分组,但由于数组不是对象(键/value) 对,但只是简单的整数,我看不出如何以相当有效的方式实现这一点。

从 json 返回上述简单 int 数组的查询是:

SELECT node.*, elem->'permissions' AS group_node_permissions
    FROM node
    LEFT OUTER JOIN
    jsonb_array_elements(my_user_group.node_permissions) elem
    ON elem->>'id' = node.id::text
    ORDER BY node.id

理想情况下,elem->'permissions'应该以{}格式的 Postgres 数组返回,这样我以后可以在其上使用ANY(intarray)函数。

我想避免做多余的低效解决方法,例如将elem->'permissions'转换为字符串,其中->>用大括号替换方括号,然后转换为整数数组,尽管这可能会起作用。

在伪代码中,我真正需要的是能够得到同样的结果:

SELECT node.*, elem->'permissions'**::integer[]** AS group_node_permissions,

...但当然由于从 json 数组到 PostgreSQL 数组格式的[]与{}的差异,这将导致错误。

这是我目前的(非常丑陋的解决方案):

SELECT node.*, replace(replace(elem->>'permissions', '[', '{'),']','}')::integer[] AS group_node_permissions

它将原来的[1, 9, 12](jsonb) 变成了{1,9,12}(integer[]) 的形式

有没有更好的解决方案?

附注

是否值得从 json(b) 转换为 int 数组 ([]),您可以在其中使用jsonarray @> '12'将数组元素获取到 Postgresinteger[]数组,您可以在其中使用12 = ANY(intarray)。有没有人知道哪个性能更高并且应该更好地扩展?现在我们可以将数组放在jsonb数据类型的列中,这是否被认为是比例如更好的方式。integer[]数据类型?

扩展信息(根据 Erwin 的要求):

SELECT DISTINCT ON (my_node.id) my_node.*
FROM user_group AS my_user_group,
LATERAL
(
    SELECT node.*, elem->'permissions' AS user_group_node_permissions
    FROM node
    LEFT OUTER JOIN
    jsonb_array_elements(my_user_group.node_permissions) elem
    ON elem->>'id' = node.id::text
    ORDER BY node.id
)my_node
WHERE (my_user_group.id = ANY('{2,3}')) --try also with just: ANY('{3}')) to see node 3 is excluded
AND (user_group_node_permissions @> '12' OR (user_group_node_permissions IS NULL AND 12 = ANY(my_user_group.default_node_permissions)));

DDL:

CREATE TABLE node
(
  id bigserial NOT NULL,
  path ltree,
  name character varying(255),
  node_type smallint NOT NULL,
  created_by bigint NOT NULL,
  created_date timestamp without time zone NOT NULL DEFAULT now(),
  parent_id bigint,
  CONSTRAINT node_pkey PRIMARY KEY (id)
)
WITH (
  OIDS=FALSE
);

CREATE TABLE user_group
(
  id serial NOT NULL,
  name character varying,
  alias character varying,
  node_permissions jsonb,
  section_ids jsonb,
  default_node_permissions jsonb
)
WITH (
  OIDS=FALSE
);

DML:

节点:

INSERT INTO node VALUES (1, '1', 'root', 5, 1, '2014-10-22 16:51:00.215', NULL);

INSERT INTO node VALUES (2, '1.2', 'Home', 1, 1, '2014-10-22 16:51:00.215', 1);
INSERT INTO node VALUES (3, '1.2.3', 'Sample Page', 1, 1, '2014-10-22 16:51:00.215', 2);
INSERT INTO node VALUES (4, '1.2.3.4', 'Child Page Level 1', 1, 1, '2014-10-26 23:19:44.735', 3);
INSERT INTO node VALUES (5, '1.2.3.4.5', 'Child Page Level 2', 1, 1, '2014-10-26 23:19:44.735', 4);

INSERT INTO node VALUES (6, '1.2.6', 'Test Page', 1, 1, '2014-12-01 11:45:16.186', 2);
INSERT INTO node VALUES (7, '1.2.7', 'Login', 1, 1, '2014-12-01 11:54:10.208', 2);
INSERT INTO node VALUES (8, '1.2.7.8', 'MySubPage', 1, 1, '2014-12-01 12:02:54.252', 7);
INSERT INTO node VALUES (9, '1.2.9', 'Yet another test page', 1, 1, '2014-12-01 12:07:29.999', 2);

INSERT INTO node VALUES (10, '1.2.10', 'Testpage 2', 1, 1, '2014-12-02 01:43:33.233', 2);
INSERT INTO node VALUES (11, '1.2.10.11', 'Test page 2 child', 1, 1, '2014-12-02 01:45:49.78', 10);

团体:

INSERT INTO user_group VALUES (2, 'Editor', 'editor', NULL, NULL, '{1,2,3,4,5,7,9,10,12}');
INSERT INTO user_group VALUES (1, 'Administrator', 'administrator', NULL, NULL, '{1,2,3,4,5,6,7,8,9,10,11,12}');
INSERT INTO user_group VALUES (3, 'Writer', 'writer', '[{"id": 3, "permissions": [1, 9]}, {"id": 4, "permissions": [1, 9, 12]}]', NULL, '{1,3,9,12}');

简短的介绍:

基本上我在这里做的是:

一个用户可以有多个组(作为整数[] 数据类型或 jsonb 数组 [] - 尚未决定,但考虑到 Erwin 的回答,整数可能是最好的,因为它不应该包含一个大数组.
可以为每个组分配对特定节点的特定访问权限*(参见下图,它解释了外部左连接),从而推翻了组默认的全局权限(权限“12”是浏览节点并因此获得它的能力)在查询中返回)
由于“writer”组确实有“12”(浏览)权限,但是id为3的节点的节点权限没有“12”权限,只有组“writer”的用户不会得到id为的节点3 在选择查询返回的结果中。但是,如果用户还有另一个组,并且不排除该节点 - 当然会返回该节点,因为更“强大”的组取代了“较弱”的组。

性能慢 - 可以优化吗?

EXPLAIN ANALYZE 查询性能

文本输出

(您可以在浏览器中放大图片)

与上述相比,一个简单的 SELECT * FROM 节点执行时间为 0.046ms(再次用 EXPLAIN ANALYZE 测量)

如果您仍然可以使用更多信息,请随时询问。

解答

显然,您有一个嵌套在外部 JSON 数组中的 JSON 数组:

SELECT n.*, array_agg(p)::int[] AS group_node_permissions
FROM   my_user_group u
     , jsonb_array_elements(u.node_permissions) elem
JOIN   node n ON n.id = (elem->>'id')::int
     , jsonb_array_elements_text(elem->'permissions') p
GROUP  BY n.id;  -- id being the PK

这是假设在permissions中没有空的 Arras。否则你需要LEFT JOIN LATERAL ... ON TRUE:

*多次调用带有数组参数的集合返回函数

这应该保留JSON数组的原始顺序,但不能保证。如果需要确定,请使用WITH ORDINALITY。

*PostgreSQL unnest() 元素编号为

LEFT [OUTER] JOIN将毫无意义,因为左表列上的后面谓词无论如何都会强制[INNER] JOIN行为。

dba.SE 上的相关答案以及更多详细信息和解释:

如何将json数组转成Postgres数组?

根据用例的详细信息,使用 GIN 索引支持查询可能是个好主意:

用于在 JSON 数组中查找元素的索引

至于您的P.S.,这取决于完整的图片。除了 Postgres 数组之外的所有其他考虑因素,它通常比保存 JSON 数组的jsonb更小更快。使用 GIN 索引可以非常快速地测试元素是否存在:

jsonarray @> '12'
intarray @> '{12}'

请特别注意,变体12 = ANY(intarray)不 GIN 索引支持。手册中有详细说明。

PostgreSQL

PostgreSQL社区为您提供最前沿的新闻资讯和知识内容

更多推荐

PostgreSQL 计数查询效率,物化视图 [重复]

问题:PostgreSQL 计数查询效率,物化视图 [重复] 可能重复: PostgreSQL 计数查询优化使用 PostgreSQL 9.2,我们试图弄清楚是否有一种方法可以跟踪查询的结果数量,并以有效的方式返回该数字。这个查询应该每秒执行几次(可能几十到几百甚至几千次)。我们现在的查询看起来像这样,但我们想知道这是否效率低下: -- Get # of rows that do not hav

PostgreSQL

多对多中的唯一性

问题:多对多中的唯一性我无法弄清楚谷歌的哪些术语,所以帮助标记这个问题或只是以相关问题的方式向我指出会有所帮助。我相信我有一个典型的多对多关系: CREATE TABLE groups ( id integer PRIMARY KEY); CREATE TABLE elements ( id integer PRIMARY KEY); CREATE TABLE groups_elements

PostgreSQL

Django 与 postgresql - manage.py syncdb 返回错误

问题:Django 与 postgresql - manage.py syncdb 返回错误我从 Django 开始。我设置了一些使用 SQLite 工作的站点,但是在将 DB 引擎更改为 postgresql manage.py syncdb 后返回错误。我已经用谷歌搜索了 2 天,但对我仍然没有任何作用。Postgres 用户 'joe' 具有超级用户权限和本地 'joe ' 数据库存在。