问题:group_by 语句、sqlalchemy 和 postgresql 的问题

我对以下查询有疑问;这本身可以正常工作,但它按秒分组,我想截断秒数并按分钟分组。我已经尝试过 date_trunc、extract 等,但我没有任何运气。当引擎是 sqlite 时,extract('minute') 工作正常,但不适用于 postgresql。

谁能指出我正确的方向?

PostgreSQL 版本:x86_64-redhat-linux-gnu 上的 PostgreSQL 8.1.23

Column('id', Integer, primary_key=True),
        Column('date', TIMESTAMP),
        Column('src', String),
        Column('dst', String),
        Column('len', String),
        Column('sport', String),
        Column('dport', String),
        Column('method', String),
        Column('host', String),
        Column('useragent', String),
        Column('statusline', String),
        Column('location', String),
        Column('server', String),
        Column('load', String),

now = datetime.datetime.now()                
DD = now - datetime.timedelta(minutes=60)    
DD = DD.strftime('%Y-%m-%d %H:%M:%S')        
query = session.query(HTTP.date,HTTP.statusline, func.count(HTTP.statusline).                                                                           
                label('count')).filter(HTTP.statusline.like('%'+status+'%'), HTTP.date>=(DD)).group_by(HTTP.date, HTTP.statusline).order_by(asc(HTTP.date)).all()

解答

在你做 anything 之前,请考虑升级到当前版本的PostgreSQL 8.1 早已死去并被遗忘了。

不完全确定符号,但随着@Audrius 在评论中的更新,它应该像这样工作:

query = session.query(
       date_trunc('min', http.date).label('date_minute')
      ,http.statusline
      ,func.count(http.statusline).label('count')
   ).filter(http.statusline.contains(status)
           ,http.date>=(DD)
   ).group_by('date_minute'
             ,http.statusline
   ).order_by(asc('date_minute')).all()

基本上,使用date_trunc('min', http.date)代替SELECT中的http.date以及GROUP BYORDER BY中的别名。

顺便说一句:我发现使用date作为timestamp的名称非常具有误导性。除此之外,我的建议是_从不_使用任何基本类型名称作为标识符。导致非常混乱的错误消息和其他难以调试的错误。

Logo

PostgreSQL社区为您提供最前沿的新闻资讯和知识内容

更多推荐