
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
【CVPR2026】CREval: 一个针对复杂指令创意图像生成的自动化可解释评估框架
本文提出CREval,一个针对复杂创意图像编辑任务的自动化评估框架。针对现有评估方法在创意任务上的不足,构建了包含874张图像和13K问答对的CREval-Bench数据集,从指令遵循、视觉一致性和视觉质量三个维度进行评估。该方法通过问答对形式实现可解释性评估,减少大模型偏见问题。实验表明,该方法与人类偏好一致,能有效评估主流生成模型在复杂创意任务上的表现。闭源模型中Seedream4.0表现最佳

到底了







