Open-AutoGLM能否用于反欺诈检测？风控流程实战案例

本文探讨了如何利用星图GPU平台自动化部署智谱开源的手机端AI Agent框架Open-AutoGLM，并将其应用于金融反欺诈风控领域。通过模拟真人操作手机应用，该框架可自动化执行社交账号核查等任务，例如自动搜索并分析抖音账号信息，作为辅助调查工具提升风控流程的效率和一致性。

笨爪

409人浏览 · 2026-03-11 03:59:49

笨爪 · 2026-03-11 03:59:49 发布

Open-AutoGLM能否用于反欺诈检测？风控流程实战案例

1. 引言：当AI智能助理遇上金融风控

想象一下这个场景：一家金融机构的风控团队，每天需要处理成千上万的交易申请。他们不仅要审核申请人的资料，还要模拟登录各种平台验证信息，检查社交账号的真实性，甚至追踪异常行为轨迹。这个过程耗时耗力，而且人工操作容易出错。

这时候，一个能“看懂”手机屏幕、能“操作”手机应用的AI智能体，是不是听起来像科幻电影里的情节？但这就是Open-AutoGLM正在做的事情。

Open-AutoGLM，特别是它的Phone Agent框架，本质上是一个能通过视觉理解手机界面，并用自然语言指令自动执行操作的AI助手。你告诉它“打开小红书搜美食”，它就能自己完成从解锁、找到App、输入搜索到浏览结果的全过程。

那么，一个能自动操作手机的AI，能不能用在严肃的反欺诈风控领域呢？今天，我们就来深入探讨这个问题，并通过一个实战案例，看看如何将这项技术落地到真实的风控流程中。

2. 理解Open-AutoGLM：不只是手机助手

在讨论具体应用前，我们先快速了解一下Open-AutoGLM Phone Agent的核心能力。这能帮助我们判断，它到底适不适合风控这种对准确性、稳定性和安全性要求极高的场景。

2.1 它到底能做什么？

简单来说，Phone Agent让AI拥有了“眼睛”和“手”。

眼睛（多模态理解）：它能像人一样，“看”懂手机屏幕上显示的是什么。不仅仅是识别文字，还能理解图标、按钮、布局、甚至图片的内容。这基于强大的视觉语言模型。
手（自动化操作）：通过ADB（安卓调试桥），它可以模拟人的触摸、滑动、输入等操作。你不需要写复杂的自动化脚本，只需要用自然语言告诉它要做什么。
大脑（规划与执行）：它不只是机械地执行命令。当你下达一个复杂指令（如“打开支付宝，查看最近三笔账单，截图发给我”），它会自己分解任务、判断当前界面状态、规划下一步操作，并处理执行过程中的意外情况。

2.2 风控场景的独特需求 vs. Phone Agent的能力

风控工作有很多环节是高度重复、规则明确但操作繁琐的。这正是自动化工具可以大显身手的地方。我们来对比一下：

风控流程常见任务	传统人工/脚本方式	Open-AutoGLM Phone Agent 的潜力
信息核验	手动在不同App间切换、复制粘贴信息、对比截图。	接收指令后，自动打开相关App，定位到关键信息页面，进行读取和比对。
行为模拟	难以大规模模拟真实用户操作路径。	可以按照预设的“剧本”（自然语言指令集），自动执行一系列操作，如登录、浏览、点击等，并记录过程中的界面反馈。
证据收集	手动截图、录屏，整理归档费时费力。	在执行任务过程中，自动在关键步骤截图或录屏，并结构化保存。
规则触发式检查	需要人工持续监控或依赖简单的API接口。	可以定时或在接到警报后，自动启动，对特定账号或设备进行“现场勘查”。

从对比可以看出，Phone Agent的核心优势在于将非结构化的界面操作，变成了结构化的、可编程的自然语言指令。这对于那些没有开放API，或者操作逻辑复杂、依赖视觉判断的验证场景，尤其有价值。

3. 实战案例：基于社交账号关联性的欺诈线索排查

理论说再多，不如看一个实际例子。我们设计一个在风控中常见的场景：通过关联社交账号信息，辅助判断申请人的真实性。

背景假设：某金融App在审核用户贷款申请时，系统提示该手机号关联的某个社交账号存在异常（例如，新注册、内容空洞、好友数极少）。风控规则需要进一步核实这个社交账号的真实性。

传统做法：审核员需要：

在自己的工作手机上，手动输入这个手机号。
打开微信/抖音/小红书等App，尝试搜索或添加好友。
人工浏览该账号的主页、发布内容、互动情况。
主观判断该账号是“正常用户”、“小号”还是“机器号”。
将判断结论记录到风控系统中。

这个过程枯燥、效率低，且判断标准因人而异。

使用Open-AutoGLM的自动化方案：

我们的目标是创建一个AI智能体，能够自动完成从搜索到初步判断的全流程。下面我们分步实现。

3.1 环境搭建与连接准备

首先，你需要一个独立的测试环境（强烈建议使用备用手机或模拟器），并完成Phone Agent的基础部署。这里简要回顾关键步骤：

准备云服务器（模型侧）：在一台有GPU的服务器上，部署Phone Agent所需的视觉语言模型（如 autoglm-phone-9b）。这通常使用vLLM等推理框架来提供高效的API服务。
准备控制端与手机（执行侧）：在你的本地电脑上，配置好ADB环境，并连接安卓手机。

# 在本地电脑上克隆控制端代码
git clone https://github.com/zai-org/Open-AutoGLM
cd Open-AutoGLM
pip install -r requirements.txt
pip install -e .

# 连接你的测试手机（确保已开启USB调试）
adb devices
# 应该能看到你的设备ID，例如 `abcd1234 device`

3.2 核心风控任务脚本开发

Phone Agent支持通过Python API进行更灵活的控制。我们可以编写一个专门用于社交账号排查的风控脚本。

# fraud_detection_agent.py
import time
import logging
from phone_agent.adb import ADBConnection
from phone_agent.agent import PhoneAgent
from phone_agent.prompts import get_prompt

# 配置日志
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
logger = logging.getLogger(__name__)

class SocialAccountInvestigator:
    def __init__(self, device_id, base_url, model_name):
        """
        初始化调查员
        :param device_id: ADB设备ID，如 `192.168.1.100:5555`
        :param base_url: 云端模型API地址，如 `http://10.0.0.1:8000/v1`
        :param model_name: 使用的模型名称
        """
        self.conn = ADBConnection()
        self.device_id = device_id
        # 连接设备
        success, msg = self.conn.connect(device_id)
        if not success:
            logger.error(f"连接设备失败: {msg}")
            raise ConnectionError(msg)
        logger.info(f"设备连接成功: {device_id}")

        # 初始化Phone Agent
        self.agent = PhoneAgent(
            adb_connection=self.conn,
            base_url=base_url,
            model=model_name
        )

    def investigate_douyin_account(self, phone_number, account_id=None):
        """
        调查抖音账号
        :param phone_number: 待核查的手机号
        :param account_id: 已知的抖音号（可选）
        :return: 调查结果字典
        """
        investigation_report = {
            "phone_number": phone_number,
            "platform": "Douyin",
            "steps": [],
            "findings": {},
            "risk_score": 0,
            "screenshots": []
        }

        try:
            # 步骤1：打开抖音
            logger.info("步骤1: 打开抖音App")
            task_prompt = f"请打开抖音App，并确保进入主界面。"
            result = self.agent.run(task_prompt)
            investigation_report["steps"].append({"action": "打开抖音", "result": result[:100]}) # 记录摘要
            time.sleep(2)

            # 步骤2：搜索目标账号
            logger.info("步骤2: 搜索账号")
            search_target = account_id if account_id else f"手机号 {phone_number}"
            task_prompt = f"""请在抖音的搜索框中输入“{search_target}”进行搜索。
            然后，在搜索结果中，尝试找到最相关的用户账号。"""
            result = self.agent.run(task_prompt)
            investigation_report["steps"].append({"action": f"搜索'{search_target}'", "result": result[:150]})
            time.sleep(3)

            # 步骤3：进入账号主页并分析（这里需要更精细的指令）
            logger.info("步骤3: 进入账号主页并分析")
            # 假设我们已经定位到了目标账号，并进入了其主页
            task_prompt = f"""现在你已经在目标抖音账号的主页。
            请执行以下分析任务：
            1. 滚动浏览其发布的视频列表，看看最近10个视频的发布频率和内容质量。
            2. 查看账号的粉丝数、获赞数、关注数，并粗略判断其量级（例如，少于100，100-1000，等）。
            3. 查看账号的简介信息。
            请用一段话总结你的观察。"""
            analysis_result = self.agent.run(task_prompt)
            investigation_report["findings"]["homepage_analysis"] = analysis_result

            # 步骤4：根据分析结果进行风险评分（简单逻辑示例）
            risk_indications = 0
            if "粉丝数很少" in analysis_result or "少于100" in analysis_result:
                risk_indications += 1
            if "内容很少" in analysis_result or "无视频" in analysis_result:
                risk_indications += 1
            if "简介为空" in analysis_result or "无简介" in analysis_result:
                risk_indications += 1

            investigation_report["risk_score"] = risk_indications * 30  # 简单加权计分
            investigation_report["conclusion"] = "高风险" if risk_indications >= 2 else ("中风险" if risk_indications == 1 else "低风险")

            # 步骤5：在关键步骤截图（示例：在分析完成后截图）
            screenshot_path = f"./evidence/douyin_{phone_number}_{int(time.time())}.png"
            self.conn.screenshot(screenshot_path)
            investigation_report["screenshots"].append(screenshot_path)
            logger.info(f"已截图保存至: {screenshot_path}")

        except Exception as e:
            logger.error(f"调查过程中发生错误: {e}")
            investigation_report["error"] = str(e)
            investigation_report["conclusion"] = "调查中断"

        return investigation_report

    def close(self):
        """关闭连接"""
        self.conn.disconnect(self.device_id)
        logger.info("设备连接已关闭")

# 使用示例
if __name__ == "__main__":
    # 配置你的参数
    DEVICE_ID = "192.168.1.100:5555"  # 你的设备ID
    BASE_URL = "http://你的云服务器IP:8000/v1"  # 你的模型API地址
    MODEL_NAME = "autoglm-phone-9b"

    investigator = SocialAccountInvestigator(DEVICE_ID, BASE_URL, MODEL_NAME)

    try:
        # 模拟调查一个手机号关联的抖音账号
        report = investigator.investigate_douyin_account(phone_number="13800138000", account_id="dycwo11nt61d")
        print("\n" + "="*50)
        print("风控调查报告")
        print("="*50)
        for key, value in report.items():
            if key != 'steps': # 步骤详情较多，可以单独查看
                print(f"{key}: {value}")
    finally:
        investigator.close()

3.3 风控流程整合与优化

上面的脚本只是一个起点。在真实的风控系统中，我们需要考虑更多：

任务可靠性：AI执行可能会失败或卡住。需要加入重试机制、超时控制以及异常状态检测（例如，判断是否真的进入了搜索页面）。
指令精细化：通用指令（“分析主页”）可能不够精确。我们需要为不同平台（微信、小红书、微博）设计专属的、步骤更明确的调查指令集。
证据链管理：自动将截图、操作日志、AI分析文本结构化存储，并与风控案件ID绑定，形成完整的电子证据链。
人机协同：对于高风险操作（如需要输入验证码的登录），或者AI置信度不高的判断，系统应自动暂停并通知人工审核员接管。
批量与调度：开发任务队列，让多个手机设备可以并行执行调查任务，并由中央调度系统分配工单。

4. 优势、挑战与未来展望

4.1 为什么说它有潜力？

突破接口限制：很多App没有对外提供查询账号详情的API。Phone Agent通过模拟真人操作，绕过了这一限制。
处理非结构化场景：风控中很多判断依赖于对图片、布局、文本组合的理解（例如，识别虚假资料截图）。多模态模型在这方面比传统规则更有优势。
提升效率与一致性：将审核员从重复的“操作工”中解放出来，专注于更高层的决策分析。同时，AI的执行标准是统一的，避免了人为波动。
7x24小时无人值守：可以设置定时任务，在夜间或节假日自动执行批量核查或监控任务。

4.2 当前面临的主要挑战

稳定性与速度：基于视觉的自动化，其执行速度远低于直接调用API，且受网络、手机性能、App界面变动影响较大，不适合对实时性要求极高的拦截场景。
成本问题：运行大型视觉语言模型需要GPU资源，处理单任务的成本需要仔细核算。
对抗与规避：黑产分子可能会针对AI的识别模式，设计专门用于对抗的界面或内容，导致AI判断失误。
安全与合规：自动化操作他人账号（即使是调查）可能触及用户协议和法律红线。必须在获得充分授权、符合监管要求的框架内进行，并确保数据安全。

4.3 更可行的落地路径

与其让AI完全替代人工审核，不如定位为“调查助理”或“线索放大器”：

初步筛查：对大量低风险或中风险申请进行快速、初步的自动化背景检查，筛选出可疑度更高的案例，交给人工深度审核。
证据固定：在人工审核发现疑点后，启动AI助理自动进行多维度信息收集和截图固定，提高人工审核的效率。
模式发现：通过分析AI在大量调查中积累的操作日志和结果，可以发现新的欺诈模式或关联特征，反哺优化规则引擎。

5. 总结

回到最初的问题：Open-AutoGLM能否用于反欺诈检测？

答案是：能，但并非作为核心决策引擎，而是作为一柄强大的、能够打开非结构化数据之门的“调查工具”。

它填补了传统API风控和人工审核之间的空白。对于那些依赖视觉验证、操作流程复杂、没有开放接口的核查场景，Phone Agent提供了一种全新的自动化思路。通过将自然语言指令转化为精准的屏幕操作，它让机器能够去“实地查看”那些原本只有人眼才能看到的信息。

本次实战案例展示了如何将其应用于社交账号核查这一具体风控环节。虽然当前技术在实际部署中还会遇到稳定性、成本和合规性的挑战，但其代表的方向——让AI更自然地与数字世界交互——无疑将为金融科技、安全审计等领域带来深远的变革。未来的风控系统，或许是规则引擎、数据模型和多个像Phone Agent这样的“现场调查员”协同工作的智能整体。