logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

FineRAG: Fine-grained Retrieval-Augmented Text-to-Image Generation ( Text→Image ) COLING 2025

1、如果你让它画一个非常罕见的生物或特定的历史零件,它可能因为没见过而“胡编乱造”。例如,使用提示“一只暹罗猫正在嗅餐桌上的圣诞老人杯子。”作为查询,可能会返回“上面画着一只猫的杯子。”,因为知识语料库中缺乏与原始查询的精确匹配。这导致知识资源不完整,无法概括“暹罗猫”和“圣诞老人杯子”的概念。2、现有的“检索增强生成”(RAG)通常直接拿用户的整句话去搜图,搜出来的参考资料往往不够精准(噪声大)

#人工智能
MyGO(2024 ACM MM)

在这些嵌入中,e𝑠𝑒𝑐,s(𝑒)封装了𝑒的全局信息,v(𝑒),w(𝑒)包含了局部模态信息。对于每个实体𝑒,我们可以收集其用于对比学习的候选对象为 C(𝑒) = {𝑒𝑠𝑒𝑐, s(𝑒), v(𝑒), w(𝑒)},它由其全局和局部特征组成。其中[CXT]是输入序列中捕获实体上下文嵌入的特殊标记,h是来自CMEE的<s:1>的输出表示,r是每个𝑟∈r的关系嵌入。为了捕获

文章图片
#深度学习#人工智能#知识图谱 +1
到底了