group_by 语句、sqlalchemy 和 postgresql 的问题

Postgredaxiang

8人浏览 · 2022-09-27 06:23:39

Postgredaxiang · 2022-09-27 06:23:39 发布

问题:group_by 语句、sqlalchemy 和 postgresql 的问题

我对以下查询有疑问;这本身可以正常工作,但它按秒分组,我想截断秒数并按分钟分组。我已经尝试过 date_trunc、extract 等,但我没有任何运气。当引擎是 sqlite 时,extract('minute') 工作正常,但不适用于 postgresql。

谁能指出我正确的方向?

PostgreSQL 版本:x86_64-redhat-linux-gnu 上的 PostgreSQL 8.1.23

Column('id', Integer, primary_key=True),
        Column('date', TIMESTAMP),
        Column('src', String),
        Column('dst', String),
        Column('len', String),
        Column('sport', String),
        Column('dport', String),
        Column('method', String),
        Column('host', String),
        Column('useragent', String),
        Column('statusline', String),
        Column('location', String),
        Column('server', String),
        Column('load', String),

now = datetime.datetime.now()                
DD = now - datetime.timedelta(minutes=60)    
DD = DD.strftime('%Y-%m-%d %H:%M:%S')        
query = session.query(HTTP.date,HTTP.statusline, func.count(HTTP.statusline).                                                                           
                label('count')).filter(HTTP.statusline.like('%'+status+'%'), HTTP.date>=(DD)).group_by(HTTP.date, HTTP.statusline).order_by(asc(HTTP.date)).all()

解答

在你做 anything 之前,请考虑升级到当前版本的PostgreSQL 8.1 早已死去并被遗忘了。

不完全确定符号,但随着@Audrius 在评论中的更新,它应该像这样工作:

query = session.query(
       date_trunc('min', http.date).label('date_minute')
      ,http.statusline
      ,func.count(http.statusline).label('count')
   ).filter(http.statusline.contains(status)
           ,http.date>=(DD)
   ).group_by('date_minute'
             ,http.statusline
   ).order_by(asc('date_minute')).all()

基本上,使用date_trunc('min', http.date)代替SELECT中的http.date以及GROUP BY和ORDER BY中的别名。

顺便说一句:我发现使用date作为timestamp的名称非常具有误导性。除此之外,我的建议是_从不_使用任何基本类型名称作为标识符。导致非常混乱的错误消息和其他难以调试的错误。

PostgreSQL

PostgreSQL社区为您提供最前沿的新闻资讯和知识内容

更多推荐

PostgreSQL 计数查询效率,物化视图 [重复]

问题:PostgreSQL 计数查询效率,物化视图 [重复] 可能重复: PostgreSQL 计数查询优化使用 PostgreSQL 9.2,我们试图弄清楚是否有一种方法可以跟踪查询的结果数量,并以有效的方式返回该数字。这个查询应该每秒执行几次(可能几十到几百甚至几千次)。我们现在的查询看起来像这样,但我们想知道这是否效率低下: -- Get # of rows that do not hav

PostgreSQL

多对多中的唯一性

问题:多对多中的唯一性我无法弄清楚谷歌的哪些术语,所以帮助标记这个问题或只是以相关问题的方式向我指出会有所帮助。我相信我有一个典型的多对多关系: CREATE TABLE groups ( id integer PRIMARY KEY); CREATE TABLE elements ( id integer PRIMARY KEY); CREATE TABLE groups_elements

PostgreSQL

Django 与 postgresql - manage.py syncdb 返回错误

问题:Django 与 postgresql - manage.py syncdb 返回错误我从 Django 开始。我设置了一些使用 SQLite 工作的站点,但是在将 DB 引擎更改为 postgresql manage.py syncdb 后返回错误。我已经用谷歌搜索了 2 天,但对我仍然没有任何作用。Postgres 用户 'joe' 具有超级用户权限和本地 'joe ' 数据库存在。