原文

论文标题:RAAR: Retrieval Augmented Agentic Reasoning for Cross-Domain Misinformation Detection(面向跨领域虚假信息检测的检索增强智能体推理框架)
论文作者:Zhiwei Liu、Runteng Guo、Baojie Qu、Yuechen Jiang、Min Peng、Qianqian Xie*、Sophia Ananiadou(* 为通讯作者)
论文来源:arXiv 2026
发布时间:2026 年 1 月 8 日
原文链接:https://arxiv.org/abs/2601.04853
项目地址:https://github.com/lzw108/RAAR

解决的问题

跨领域虚假信息检测具有极大的挑战性,原因在于虚假信息出现在不同领域中,各领域的知识体系和话语特征存在显著差异。现有方法往往依赖单一视角线索,难以推广至复杂或样本量不足的领域。

其一,机器学习和深度学习方法需要为每个虚假信息检测任务单独进行微调或设计特定提示词,导致单个模型只能处理一项任务,无法实现跨任务泛化。

其二,大多数方法仅从单一视角分析数据,未能整合情感、写作风格、语义等多个维度的信息,在复杂或高难度领域的检测效果大打折扣。

其三,模型普遍缺乏对模糊或隐含证据的系统性推理能力,进一步制约了其在样本量不足领域的性能。

方案

提出首个面向跨领域虚假信息检测的检索增强智能体推理框架 RAAR。该框架融合检索增强智能体推理、有监督微调与强化学习技术,实现了跨领域知识迁移、多维度推理和多任务优化。RAAR 通过三个核心阶段解决现有方法的局限:

(1)检索增强数据构建:为突破同分布假设的限制,为模型提供丰富的跨领域证据,针对每个目标领域样本,检索与其语义、情感、风格相似的源领域数据,为后续分析提供多视角参考。

(2)多智能体协作推理路径构建:为对复杂、模糊的证据进行系统性、多维度推理,由专业子智能体分别从语义、情感、风格角度展开分析,汇总智能体在验证器的指导下整合各子智能体的输出结果并进行进一步推理。

(3)模型优化:为提升预测准确率和跨领域推理能力,采用有监督微调与强化学习方法,使单个模型能够处理虚假新闻、谣言、阴谋论等多种虚假信息检测任务,突破传统模型的单任务局限。

方法

1. 任务

给定多个源领域数据集 DsD_sDs 和一个目标领域虚假信息数据集 DtD_tDt,核心任务是借助源领域知识,提升模型在高难度目标领域的检测性能。形式化定义为:

{Ds,Dt}⊆D={(x,y∗)} \{D_s, D_t\} \subseteq D = \{(x, y^*)\} {Ds,Dt}D={(x,y)}

其中 xxx 表示文本内容,y∗y^*y 表示对应的标签。DtD_tDt 为选定的高难度领域。整个过程分为三个阶段。

阶段一:检索增强数据构建
针对每个目标领域样本 (xt,y∗)(x^t, y^*)(xt,y),检索与其语义 (xsems,ysems)(x_{sem}^s, y_{sem}^s)(xsems,ysems)、情感 (xsens,ysens)(x_{sen}^s, y_{sen}^s)(xsens,ysens)、风格 (xstys,ystys)(x_{sty}^s, y_{sty}^s)(xstys,ystys) 相似的源领域数据:

Dra=Retrieval(D)={(xra,y∗)} D_{ra} = \text{Retrieval}(D) = \{(x_{ra}, y^*)\} Dra=Retrieval(D)={(xra,y)}

其中
xra={xt,(xsens,ysens),(xsems,ysems),(xstys,ystys)} x_{ra} = \left\{ x_t, (x_{sen}^s, y_{sen}^s), (x_{sem}^s, y_{sem}^s), (x_{sty}^s, y_{sty}^s) \right\} xra={xt,(xsens,ysens),(xsems,ysems),(xstys,ystys)}

DraD_{ra}Dra 分为 DsearchD_{search}DsearchDRLD_{RL}DRL,分别用于阶段2的推理路径搜索和阶段3的强化学习。

阶段2:多智能体协作推理路径构建
DSFT=MultiAgents(Dsearch)={(xra,CoT^,y^)} D_{SFT} = \text{MultiAgents}(D_{search}) = \left\{ (x_{ra}, \hat{CoT}, \hat{y}) \right\} DSFT=MultiAgents(Dsearch)={(xra,CoT^,y^)}

其中 CoTCoTCoT 为多视角推理路径,y^\hat{y}y^ 为基于该推理路径得到的最终答案。

阶段3:两步式模型优化
πθRAAR=RL(πθsft)(DRL,CoTRL,y^RL,Reward) \pi_\theta^{RAAR} = RL_{(\pi_\theta^{sft})}(D_{RL}, CoT_{RL}, \hat{y}_{RL}, \text{Reward}) πθRAAR=RL(πθsft)(DRL,CoTRL,y^RL,Reward)

其中 πθ\pi_\thetaπθ 为初始大语言模型,奖励函数包含准确率奖励和格式奖励。模型先通过有监督微调获得推理能力,再利用 DRLD_{RL}DRL 数据生成初始推理结果,最后通过强化学习进一步优化。

完成所有阶段后,得到优化后的 RAAR 大语言模型 πθRAAR\pi_\theta^{RAAR}πθRAAR,最终目标是通过优化初始模型 πθ\pi_\thetaπθ,使其能够实现多视角推理并输出更准确的最终答案 y^\hat{y}y^

2. 阶段1:检索增强数据构建

本阶段的核心是为每个目标领域样本,从源领域数据中检索多视角参考样本,为后续推理路径的构建奠定基础。本文通过统计分析对比了不同模型的性能,最终选择 EmoLLama(Liu 等人,2024b)、RoBERTa(Liu 等人,2019)和 StyleEmb(Wegmann 等人,2022)作为嵌入模型。

利用 EmoLLama、RoBERTa 和 StyleEmb 对输入文本进行编码,提取模型最后一层的隐藏状态作为情感嵌入 (Esent,Esens)(E_{sen}^t, E_{sen}^s)(Esent,Esens),语义嵌入 (Esemt,Esems)(E_{sem}^t, E_{sem}^s)(Esemt,Esems) 和写作风格嵌入 (Estyt,Estys)(E_{sty}^t, E_{sty}^s)(Estyt,Estys)

以情感检索过程为例:

Esens=EmoLlama(Ds)=(esens1,esens2,...,esensN) E_{sen}^s = \text{EmoLlama}(D_s) = \left( e_{sen}^{s_1}, e_{sen}^{s_2}, ..., e_{sen}^{s_N} \right) Esens=EmoLlama(Ds)=(esens1,esens2,...,esensN)

其中,MMM 为目标领域样本数量,NNN 为源领域样本数量。遍历目标领域情感嵌入 EsentE_{sen}^tEsent 中的每个嵌入向量 esente_{sen}^tesent,计算其与源领域情感嵌入 EsensE_{sen}^sEsens 中每个向量 esense_{sen}^sesens 的余弦相似度,为每个目标领域样本选取相似度最高的 kkk 个源领域样本 (xsens,ysens)(x_{sen}^s, y_{sen}^s)(xsens,ysens),构建检索增强数据集 DraD_{ra}Dra,作为后续分析的少样本示例。语义和风格嵌入的检索流程与情感检索完全一致。最终得到完整的检索增强数据集 Dra={(xra,y∗)}D_{ra} = \{(x_{ra}, y^*)\}Dra={(xra,y)},其中:

xra={xt,(xsens,ysens),(xsems,ysems),(xstys,ystys)} x_{ra} = \left\{ x_t, (x_{sen}^s, y_{sen}^s), (x_{sem}^s, y_{sem}^s), (x_{sty}^s, y_{sty}^s) \right\} xra={xt,(xsens,ysens),(xsems,ysems),(xstys,ystys)}

xrax_{ra}xra 为检索增强样本,y∗y^*y 为真实标签。

DraD_{ra}Dra 均分为两部分:DsearchD_{search}DsearchDRLD_{RL}DRL,分别用于阶段 2 的推理路径搜索与阶段 3 的强化学习。

3. 阶段2:多智能体协作推理路径构建

得到 DsearchD_{search}Dsearch 后,引入多智能体框架,实现对复杂、模糊证据的系统性、多维度推理。设置三个专业子智能体:情感智能体 AsenA_{sen}Asen、语义智能体 AsemA_{sem}Asem、风格智能体 AstyA_{sty}Asty,分别从各自视角分析 DsearchD_{search}Dsearch 并生成维度专属的分析结果及支撑依据;汇总智能体 AsumA_{sum}Asum 整合各子智能体的输出,构建连贯的推理路径。

CoTsub,ysub=SubAgents(Dsearch) CoT^{sub}, y^{sub} = \text{SubAgents}(D_{search}) CoTsub,ysub=SubAgents(Dsearch)

其中,CoTsub={CoTsen,CoTsem,CoTsty}CoT^{sub} = \{CoT_{sen}, CoT_{sem}, CoT_{sty}\}CoTsub={CoTsen,CoTsem,CoTsty} 为各个智能体的推理路径,ysub={ysen,ysem,ysty}y^{sub} = \{y_{sen}, y_{sem}, y_{sty}\}ysub={ysen,ysem,ysty} 为各子智能体的预测结果。随后,汇总智能体整合各视角信息并进行进一步推理,生成初始推理链 CoT0CoT_0CoT0 和初始预测结果 y0y_0y0

CoT0,y0=Asum(CoTsub,ysub) CoT_0, y_0 = A_{sum}(CoT^{sub}, y^{sub}) CoT0,y0=Asum(CoTsub,ysub)

Verifier(y0,y∗)∈{True,False} \text{Verifier}(y_0, y^*) \in \{ \text{True}, \text{False} \} Verifier(y0,y){True,False}

采用基于大语言模型的验证器判断初始预测结果 y0^\hat{y_0}y0^ 是否正确。若预测错误,三个子智能体和汇总智能体将协同采用多种策略,寻找正确的推理路径。

子智能体策略

双重校验:告知子智能体汇总智能体的答案错误,需对自身分析结果进行自我验证。若发现错误则修正,若坚持原观点则补充论证依据。

交叉沟通:向子智能体告知其他子智能体的分析结果和推理路径,若发现自身分析存在问题则修正,若坚持原观点则进一步补充理由。

汇总智能体策略

1)跨智能体整合:聚合各子智能体的输出,生成统一答案。
2)跨智能体重审:通过交叉核对各子智能体的推理依据,重新评估当前推理路径。
3)跨智能体拓展:利用各子智能体的分析线索,探索新的推理路径。
4)跨智能体验证:从多视角验证当前推理路径的一致性。
5)跨智能体修正:结合各子智能体的分析内容,识别并修正当前推理路径中的潜在缺陷。

搜索过程中,先由汇总智能体更新推理结果;若答案仍错误,则回溯至子智能体进行更新。若经过 NNN 轮迭代仍未找到正确推理路径,则为各智能体提供适当提示,使其重新审视此前的推理步骤,基于验证器的反馈优化假设,调整推理过程,直至得到正确的推理路径。

得到完整且正确的推理路径后,利用大语言模型梳理所有推理步骤,生成更符合人类思维习惯、更直观的推理过程 CoT^\hat{CoT}CoT^

CoT^=LLMrephrase(CoT0,CoT1,...,CoTN,xra) \hat{CoT} = \text{LLMrephrase}(CoT_0, CoT_1, ..., CoT_N, x_{ra}) CoT^=LLMrephrase(CoT0,CoT1,...,CoTN,xra)

基于该自然化推理过程,生成丰富、高质量的最终答案 y^\hat{y}y^,要求 y^\hat{y}y^ 的第一段为明确的检测结果,第二段为总结性的分析说明:

y^=LLMrefine(CoT^,xra) \hat{y} = \text{LLMrefine}(\hat{CoT}, x_{ra}) y^=LLMrefine(CoT^,xra)

4. 阶段三:模型优化

4.1 检索增强有监督微调

收集上述自然化推理过程 CoT^\hat{CoT}CoT^ 和最终答案 y^\hat{y}y^ 后,利用附录C.3的模板构建有监督微调数据集 DSFTD_{SFT}DSFT,输入为检索增强数据 xrax_{ra}xra。给定初始大语言模型 πθ\pi_\thetaπθ,通过有监督微调得到模型 πθsft\pi_\theta^{sft}πθsft

LSFT(θ)←−log⁡πθ(CoT^,y^∣xra) L_{SFT}(\theta) \leftarrow -\log \pi_\theta(\hat{CoT}, \hat{y} \mid x_{ra}) LSFT(θ)logπθ(CoT^,y^xra)
θ←θ−η∇(θ)LSFT(θ) \theta \leftarrow \theta - \eta \nabla(\theta) L_{SFT}(\theta) θθη(θ)LSFT(θ)

有监督微调阶段引导模型在输出最终答案前,系统性地构建推理过程。训练基于检索增强数据展开,鼓励模型进行多步、多视角推理,训练目标为“最终答案+总结性分析”的组合输出。该方式能培养模型连贯的分析思维,同时提升跨领域虚假信息检测的可解释性和准确率。

4.2 强化学习

在强化学习阶段,采用组相对策略优化算法(GRPO)进一步提升推理能力。

训练数据集 DRLD_{RL}DRL 中的每个样本包含 xrax_{ra}xray∗y^*y 两部分,其中 xrax_{ra}xra 为输入问题,y∗y^*y 为仅包含最终答案、无推理过程的模型目标输出。参考现有研究(Zhu等人,2025;Liu等人,2025b),设计两种奖励机制:准确率奖励,鼓励模型输出正确答案;格式奖励,确保模型生成的输出符合预设格式。

格式奖励:要求模型输出严格遵循以下结构:
\n[reasoning]\n\n\n\n[firstsentence]\n\n[response]

中文对应格式:
(思考)\n[推理]\n(/思考)\n\n(答案)\n[第一句话]\n\n[回应](/答案)

其中 [firstsentence](第一句话)为核心结论,需明确包含预测标签。若输出格式符合要求,奖励值为 1,否则为 0;

准确率奖励:答案正确得 1 分,错误得 0.1 分,未给出答案得 0 分。与基于大语言模型的评估不同,该奖励通过硬编码规则直接计算,要求模型在第一句话中明确给出答案。

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐