wsygxxn 个人主页

@wsygxxn

wsygxxn

2023-09-06 16:06:23 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【CVPR2026】CREval: 一个针对复杂指令创意图像生成的自动化可解释评估框架

本文提出CREval，一个针对复杂创意图像编辑任务的自动化评估框架。针对现有评估方法在创意任务上的不足，构建了包含874张图像和13K问答对的CREval-Bench数据集，从指令遵循、视觉一致性和视觉质量三个维度进行评估。该方法通过问答对形式实现可解释性评估，减少大模型偏见问题。实验表明，该方法与人类偏好一致，能有效评估主流生成模型在复杂创意任务上的表现。闭源模型中Seedream4.0表现最佳

#自动化 #运维

到底了