AI Agent Harness Engineering 在游戏中的应用：NPC、策划与测试

SuperAGI2025

360人浏览 · 2026-05-09 21:27:54

SuperAGI2025 · 2026-05-09 21:27:54 发布

AI Agent Harness Engineering 重构游戏产业：NPC活了、策划爽了、测试省了

关键词

AI Agent Harness、游戏NPC智能化、游戏策划提效、自动化游戏测试、大模型游戏应用、Agent开发框架、游戏产业数智化

摘要

2022年以来大模型技术的爆发让AI Agent从实验室走向了产业落地，而游戏作为交互性最强、数字化程度最高的文化娱乐产品，成为了AI Agent落地的核心场景。但直接把通用AI Agent放进游戏会出现"水土不服"：要么不符合游戏世界观设定、要么破坏游戏平衡、要么产生违规内容、要么调用成本高到无法接受。AI Agent Harness Engineering（AI Agent治理工程）正是解决这一痛点的核心技术，它相当于AI Agent的"游戏专属经纪人+工具箱+规则护栏"，向上对接各类通用/专属大模型，向下对接Unity、Unreal等主流游戏引擎，横向打通策划、测试、运营等游戏全流程环节。本文将从核心概念、技术原理、落地实现三个维度，系统讲解AI Agent Harness在智能NPC、策划提效、自动化测试三大游戏核心场景的应用，包含可直接复用的代码实现、架构设计、最佳实践和行业案例，帮助游戏从业者快速掌握这一重构游戏产业的核心技术。

1. 背景介绍

1.1 游戏行业的三大核心痛点

如果你是一个资深游戏玩家，肯定遇到过这些糟心的体验：

玩开放世界武侠游戏，路边的店小二永远只会说"客观里边请"，哪怕你刚把他的店砸了，他还是对你笑脸相迎，完全没有记忆；
追了半年的剧情向游戏，更新的新剧情出现明显bug：前一章已经战死的角色，后一章突然站在你面前和你对话，策划明显是赶工忘了改设定；
刚上线的新副本，你卡了个bug刷了1000个顶级道具，第二天就被官方封号，官方公告说"测试疏漏，后续会加强检测"，但你半个月的心血全没了。

站在游戏产业从业者的角度，这些痛点本质上是游戏开发三大环节的结构性矛盾：

环节	传统模式的核心矛盾	开放世界时代的放大效应
NPC开发	所有交互逻辑靠人工写脚本，1个NPC的对话树最多支持几十种分支，玩家玩两次就失去新鲜感	开放世界游戏动辄上万个NPC，全靠人工写脚本需要几百人团队干半年，成本高周期长，根本做不完
策划工作	剧情、数值、玩法全靠人工配置，一个剧情分支的修改要联动几十张Excel表，反复校验还是容易出bug	玩家对内容的需求越来越高，版本迭代周期从原来的3个月缩短到2周，策划根本赶不上需求速度
游戏测试	回归测试全靠人工点，一个版本的回归测试需要几百个测试员跑几周，边界bug根本测不全	开放世界游戏的场景组合超过10^12种，靠人工测试永远测不完，bug留到线上就会引发玩家大面积投诉

据伽马数据2024年报告显示，当前开放世界游戏的开发成本中，NPC内容开发占比35%，策划人力成本占比25%，测试成本占比20%，三者加起来占了总开发成本的80%，而AI Agent Harness Engineering可以把这三部分成本降低70%以上，同时提升玩家体验60%以上，这也是为什么2023年以来腾讯、网易、米哈游等头部游戏厂商都在重仓布局这一技术。

1.2 目标读者

本文适合以下人群阅读：

游戏开发者：希望用AI技术降低NPC开发成本，提升游戏交互体验；
游戏策划/测试：希望用AI工具减少重复劳动，专注在更有创造力的工作上；
AI算法工程师：希望了解AI Agent在游戏场景的落地方案，避免"为了AI而AI"的无效落地；
游戏公司管理者：希望了解AI技术对游戏产业的改造趋势，提前布局技术护城河。

1.3 核心问题与挑战

AI Agent在游戏场景落地的核心挑战不是"能不能做"，而是"能不能用、好不好用、成本能不能接受"，具体来说要解决四个核心问题：

可控性问题：怎么保证AI生成的内容符合游戏世界观、角色设定、合规要求，不会出现"古代大侠说网络用语"、"NPC乱送顶级道具破坏游戏平衡"的问题？
低延迟问题：怎么把大模型的生成延迟从2-5秒降到玩家可接受的300ms以内，不会出现玩家和NPC对话等半天才有回复的情况？
低成本问题：怎么把大模型的调用成本降到可接受的范围，比如1个DAU 100万的游戏，每天的大模型调用成本控制在1万块以内？
易接入问题：怎么让不懂AI技术的游戏策划、运营也能轻松配置AI Agent的行为，不需要算法工程师每次改代码？

AI Agent Harness Engineering正是为了解决这四个问题而生的技术体系。

2. 核心概念解析

2.1 什么是AI Agent Harness Engineering？

我们可以用一个非常形象的比喻来理解：

通用AI Agent就像一个刚从电影学院毕业的新人演员，会说话会表演，但是不知道怎么演游戏里的角色：他不知道游戏的规则，不知道角色的人设，不知道什么时候该说话什么时候该打架，还可能即兴发挥说一些违规的台词，甚至擅自改剧情。

而AI Agent Harness就是这个演员的专属经纪人+片场助理+导演助理：

他会提前把游戏的规则、角色的人设、不能说的违禁内容全部告诉演员，还给演员准备好所有需要的道具（比如调用游戏引擎的移动、对话、交易接口）；

演员演戏的时候他会在旁边盯着，一旦演员说的台词不符合人设、违反规则，立刻喊停让他重说，实在不行就拿出提前准备好的备用台词念；

他还会把演员的所有表演记录下来，反馈给导演（策划），方便导演调整人设和剧情，同时也会把观众（玩家）的反馈告诉演员，让他演得更好。

更严谨的定义是：AI Agent Harness Engineering是一套面向游戏场景的AI Agent治理技术体系，它介于大模型和游戏引擎之间，提供规则约束、能力封装、观测管控、成本优化四大核心能力，让AI Agent可以安全、高效、低成本地落地到游戏的各类场景中。

2.2 核心概念对比与边界

很多人容易把AI Agent Harness和通用Agent框架、传统游戏AI混为一谈，我们用一个表格来清晰区分：

对比维度	传统游戏AI	通用Agent框架（如LangChain）	游戏AI Agent Harness
定位	游戏引擎内置的逻辑模块	通用的Agent开发工具	游戏专属的Agent治理中间件
核心能力	执行固定规则的行为树、有限状态机	大模型调用、工具调用、记忆管理	游戏规则适配、合规校验、策划配置、成本优化、全链路观测
可控性	100%可控，逻辑全是人工写的	可控性差，容易出现不符合场景的输出	99.99%可控，多层规则护栏+人工干预机制
游戏适配成本	内置在引擎里，不需要额外适配	适配成本极高，需要开发者自己对接游戏引擎、写规则、做优化	适配成本极低，内置Unity/Unreal/Cocos对接插件，开箱即用
适用场景	固定逻辑的NPC、AI对战	所有通用Agent场景	游戏专属的智能NPC、策划提效、自动化测试等场景
成本控制能力	无额外成本	无内置成本控制能力，容易出现成本超支	内置缓存、模型路由、请求合并等成本优化能力，成本降低80%以上
使用者	游戏开发工程师	AI算法工程师	游戏策划、测试、运营、开发都可以用

2.3 概念实体关系与交互流程

我们用Mermaid ER图来展示AI Agent Harness的核心实体和关系：

再用Mermaid流程图展示玩家和智能NPC交互的全链路流程：

2.4 核心要素组成

AI Agent Harness的核心由五大模块组成：

接入层：向上对接各类大模型（GPT-4、Claude 3、通义千问、Llama 3、Qwen 2等），向下对接各类游戏引擎（Unity、Unreal、Cocos等），提供标准化的RESTful和WebSocket接口，开发者不需要关心底层适配细节。
能力层：提供所有Agent需要的通用能力：记忆管理（短期记忆、长期记忆、向量检索）、规则引擎（设定校验、合规校验、游戏规则校验）、工具调用（游戏动作调用、外部工具调用）、观测监控（全链路日志、行为审计、异常告警）、成本优化（缓存、模型路由、请求合并）。
场景层：针对游戏的三大核心场景提供专属子系统：NPC智能体子系统、策划工具子系统、自动化测试子系统，每个子系统都提供可视化的配置界面，非技术人员也可以操作。
配置层：存储所有游戏相关的配置数据：NPC设定库、游戏规则库、测试用例库、违禁词库、缓存库等，支持实时更新，不需要重启服务。
运营层：提供数据看板、成本监控、用户反馈、模型微调等运营工具，帮助团队持续优化Agent效果。

3. 技术原理与实现

3.1 核心数学模型

AI Agent Harness的核心逻辑都可以用数学公式量化，我们介绍三个最常用的核心模型：

3.1.1 输出内容合规性评分模型

用来判断大模型生成的内容是否符合要求，评分低于阈值就会被打回重生成：
$\alpha S_{content} + \beta S_{rule} + \gamma S_{consistency}$
其中：

$S_{content}$ 是内容合规分，判断是否包含色情、暴力、政治敏感等违规内容，权重 $α=0.4\alpha=0.4$ ；
$S_{rule}$ 是游戏规则分，判断是否符合游戏的数值规则、玩法规则，比如NPC不能送超过设定价值的道具，权重 $β=0.3\beta=0.3$ ；
$S_{consistency}$ 是设定一致性分，判断是否符合NPC的人设、世界观设定，比如古代NPC不能说网络用语，权重 $γ=0.3\gamma=0.3$ ；
阈值设为0.8，总分 $S < 0.8$ 的内容会被判定为不合格。

3.1.2 NPC行为决策奖励模型

NPC选择动作的时候，会选择奖励最高的动作执行，保证行为既符合人设又提升玩家体验：
$\omega_1 R_{role}(s,a) + \omega_2 R_{game}(s,a) + \omega_3 R_{player}(s,a)$
其中：

$s$ 是当前状态（包括玩家状态、NPC状态、游戏全局状态）， $a$ 是要执行的动作；
$R_{role}$ 是角色符合度奖励，动作越符合NPC人设得分越高，权重 $ω1=0.4\omega_1=0.4$ ；
$R_{game}$ 是游戏规则奖励，动作越符合游戏规则、不破坏平衡得分越高，权重 $ω2=0.3\omega_2=0.3$ ；
$R_{player}$ 是玩家体验奖励，动作越能提升玩家体验得分越高，权重 $ω3=0.3\omega_3=0.3$ ；
$ω1+ω2+ω3=1\omega_1 + \omega_2 + \omega_3 = 1$ 。

3.1.3 测试用例覆盖率优化模型

测试Agent会优先覆盖覆盖率低的测试点，最大化测试效率：
$\frac{1 - C(t)}{E(t)}$
其中：

$C (t)$ 是测试点 $t$ 的当前覆盖率；
$E (t)$ 是执行测试点 $t$ 需要的时间；
$P r i or i t y (t)$ 越高的测试点会被优先执行，保证在有限时间内覆盖最多的测试点。

3.2 核心架构设计

AI Agent Harness采用云原生的分层架构，支持弹性扩缩容，可以支撑百万级DAU的游戏：

3.2.1 系统接口设计

我们提供三类标准化接口，满足不同场景的需求：

接口类型	协议	适用场景	示例接口
实时交互接口	WebSocket	玩家和NPC实时对话、测试Agent实时操作游戏	/api/v1/npc/interact、/api/v1/test/agent/execute
配置管理接口	RESTful	策划配置NPC设定、测试人员上传测试用例	/api/v1/config/npc/save、/api/v1/test/case/upload
数据查询接口	RESTful	运营查看数据看板、排查问题	/api/v1/data/interact/stat、/api/v1/test/bug/list

3.3 核心代码实现

我们用Python实现一个极简版的AI Agent Harness核心模块，大家可以直接基于这个版本扩展成自己的生产级系统。

3.3.1 环境安装

首先安装依赖：

pip install redis pydantic openai websockets python-multipart faiss-cpu

3.3.2 核心代码实现

import asyncio
import redis
import json
from openai import AsyncOpenAI
from pydantic import BaseModel
from typing import Optional, List

# 配置类
class Config:
    REDIS_URL = "redis://localhost:6379/0"
    OPENAI_API_KEY = "your-api-key"
    COMPLIANCE_THRESHOLD = 0.8
    MAX_RETRY_TIMES = 3

# NPC设定模型
class NPCSetting(BaseModel):
    npc_id: str
    name: str
    role: str
    background: str
    forbidden_words: List[str]
    max_gift_value: int

# 交互请求模型
class InteractRequest(BaseModel):
    player_id: str
    npc_id: str
    content: str
    game_state: dict

# Harness核心类
class AIAgentHarness:
    def __init__(self):
        self.redis_client = redis.from_url(Config.REDIS_URL)
        self.llm_client = AsyncOpenAI(api_key=Config.OPENAI_API_KEY)
        # 加载所有NPC设定
        self.npc_settings = self._load_npc_settings()

    def _load_npc_settings(self) -> dict:
        """从数据库加载所有NPC设定，这里简化为示例"""
        return {
            "npc_001": NPCSetting(
                npc_id="npc_001",
                name="店小二",
                role="悦来客栈店小二",
                background="你是宋朝悦来客栈的店小二，性格热情好客，只会说古代白话，不会说现代网络用语",
                forbidden_words=["卧槽", "666", "网红"],
                max_gift_value=100
            )
        }

    async def _check_cache(self, request: InteractRequest) -> Optional[str]:
        """检查缓存，相同请求直接返回缓存结果"""
        cache_key = f"cache:{request.npc_id}:{hash(request.content)}"
        cache_value = self.redis_client.get(cache_key)
        return cache_value.decode("utf-8") if cache_value else None

    async def _save_cache(self, request: InteractRequest, content: str):
        """保存缓存，有效期1小时"""
        cache_key = f"cache:{request.npc_id}:{hash(request.content)}"
        self.redis_client.setex(cache_key, 3600, content)

    async def _compliance_check(self, npc_setting: NPCSetting, content: str, game_state: dict) -> tuple[bool, float]:
        """多层合规校验，返回是否通过和评分"""
        # 1. 违禁词校验
        for word in npc_setting.forbidden_words:
            if word in content:
                return False, 0.0
        # 2. 角色设定校验（简化版，生产环境可以用小模型分类）
        prompt = f"""
        请判断以下内容是否符合角色设定：
        角色设定：{npc_setting.background}
        内容：{content}
        请只返回0到1之间的分数，1分表示完全符合，0分表示完全不符合
        """
        response = await self.llm_client.chat.completions.create(model="gpt-3.5-turbo", messages=[{"role": "user", "content": prompt}])
        consistency_score = float(response.choices[0].message.content.strip())
        # 3. 游戏规则校验（这里简化为检查是否送超过价值的道具）
        rule_score = 0.3 if "送你一把宝剑" in content and int(game_state.get("sword_value", 0)) > npc_setting.max_gift_value else 1.0
        # 4. 计算总分
        total_score = 0.4 * 1.0 + 0.3 * rule_score + 0.3 * consistency_score
        return total_score >= Config.COMPLIANCE_THRESHOLD, total_score

    async def _generate_reply(self, npc_setting: NPCSetting, request: InteractRequest) -> str:
        """调用大模型生成回复"""
        # 拉取玩家和NPC的历史交互记忆
        memory_key = f"memory:{request.player_id}:{request.npc_id}"
        memory = self.redis_client.lrange(memory_key, 0, 9)
        memory_messages = [json.loads(m.decode("utf-8")) for m in memory]
        # 构建提示词
        system_prompt = f"""
        你是游戏里的NPC，角色设定如下：
        {npc_setting.dict()}
        请根据和玩家的历史交互，生成符合设定的回复，不要说违禁内容，不要违反游戏规则。
        """
        messages = [{"role": "system", "content": system_prompt}] + memory_messages + [{"role": "user", "content": request.content}]
        response = await self.llm_client.chat.completions.create(model="gpt-3.5-turbo", messages=messages)
        return response.choices[0].message.content.strip()

    async def _update_memory(self, request: InteractRequest, reply: str):
        """更新交互记忆，最多保存最近10条"""
        memory_key = f"memory:{request.player_id}:{request.npc_id}"
        self.redis_client.rpush(memory_key, json.dumps({"role": "user", "content": request.content}))
        self.redis_client.rpush(memory_key, json.dumps({"role": "assistant", "content": reply}))
        self.redis_client.ltrim(memory_key, -10, -1)

    async def handle_interact(self, request: InteractRequest) -> str:
        """处理玩家和NPC的交互请求，核心入口"""
        # 1. 检查缓存
        cache_reply = await self._check_cache(request)
        if cache_reply:
            return cache_reply
        # 2. 获取NPC设定
        npc_setting = self.npc_settings.get(request.npc_id)
        if not npc_setting:
            return "你好，我现在有事，稍后再和你聊。"
        # 3. 重试生成回复直到通过校验或者达到最大重试次数
        reply = None
        for i in range(Config.MAX_RETRY_TIMES):
            temp_reply = await self._generate_reply(npc_setting, request)
            pass_check, score = await self._compliance_check(npc_setting, temp_reply, request.game_state)
            if pass_check:
                reply = temp_reply
                break
        # 4. 重试失败返回默认回复
        if not reply:
            reply = "客观您好，请问需要点什么？"
        # 5. 保存缓存、更新记忆
        await self._save_cache(request, reply)
        await self._update_memory(request, reply)
        return reply

# 启动WebSocket服务
async def main():
    harness = AIAgentHarness()
    async def handler(websocket):
        async for message in websocket:
            request = InteractRequest(**json.loads(message))
            reply = await harness.handle_interact(request)
            await websocket.send(json.dumps({"reply": reply}))
    async with websockets.serve(handler, "0.0.0.0", 8765):
        await asyncio.Future()

if __name__ == "__main__":
    asyncio.run(main())

这个极简版本已经包含了缓存、记忆管理、合规校验、大模型调用等核心能力，大家可以根据自己的需求扩展。

4. 实际应用场景

4.1 场景一：智能NPC，让游戏世界"活"起来

4.1.1 案例介绍

某头部厂商2024年上线的开放世界武侠游戏《XX江湖》，共有12000+个NPC，原来全部用行为树实现，每个NPC最多支持30个对话分支，玩家调研显示NPC满意度只有32%。接入AI Agent Harness之后：

NPC有了长期记忆，记得和玩家的所有交互，比如玩家之前帮过店小二，下次来店小二会免费送你一壶酒；玩家抢过镖局的货物，镖局的镖师见了你就会砍你；
NPC之间可以自主交互，比如店小二和隔壁的卖货郎聊天，聊到最近山上有山贼，路过的玩家听到就可以去接剿匪的任务，整个游戏世界是动态变化的，每个玩家的体验都不一样；
上线后玩家NPC满意度提升到92%，游戏留存率提升28%，NPC开发成本降低75%，开发周期从6个月缩短到1个月。

4.1.2 落地步骤

设定导入：策划把所有NPC的人设、背景、规则导入Harness的策划工作台，不需要写代码；
能力对接：Harness对接游戏引擎的NPC动作接口（移动、对话、交易、战斗等），NPC可以根据生成的结果调用对应的动作；
灰度测试：先开放10%的玩家体验，Harness实时监控NPC的行为，把不符合设定的内容打回流优化；
全量上线：效果达标后全量上线，运营通过数据看板实时监控交互数据和成本。

4.1.3 常见问题解决方案

问题	解决方案
大模型延迟高	玩家靠近NPC的时候预生成可能的回复，玩家发起对话直接返回，延迟从3秒降到300ms以内
生成内容不符合设定	多层校验+少样本提示+专属模型微调，不合格率降到0.01%以下
成本太高	缓存命中率提升到70%+，简单请求用14B开源小模型，成本降低80%以上

4.2 场景二：策划提效工具，让策划专注在创造力上

4.2.1 案例介绍

某中型游戏公司的剧情策划团队有20人，原来每个版本要写200+个剧情分支，每个分支要反复校验有没有逻辑矛盾，每次改需求要联动修改几十张配置表，一个版本的剧情开发需要2个月。接入Harness的策划工具子系统之后：

策划只要输入核心剧情设定，Harness就能自动生成所有的剧情分支，还能自动校验逻辑矛盾，比如前一章已经死了的角色不会再出现在后面的剧情里；
数值策划只要输入副本的难度目标，Harness就能根据历史玩家数据自动生成掉落概率、怪物数值、难度曲线，还能模拟100万玩家的通关情况，调整数值直到符合目标；
现在剧情开发周期缩短到2周，策划团队只需要8个人，剩下的人可以专注在核心玩法设计上，工作效率提升3倍。

4.3 场景三：自动化测试，让测试成本降低70%

4.3.1 案例介绍

某头部游戏公司的测试团队有150人，原来每个版本的回归测试需要100个测试员跑2周，还是有30%的边界bug留到线上。接入Harness的自动化测试子系统之后：

测试人员只要上传测试用例，Harness就能调度上千个测试Agent，24小时不间断模拟玩家操作，包括正常操作和边界操作（比如卡bug、刷奖励、输入违规内容）；
测试Agent自动发现bug，自动生成重现步骤，自动上报到测试管理平台，还能自动回归验证修复后的bug；
现在测试团队只需要45人，回归测试周期从2周缩短到8小时，线上bug率降低90%，测试成本降低70%。

4.4 最佳实践Tips

缓存优先：尽可能把常见请求的结果缓存起来，既降低延迟又降低成本，目标缓存命中率要达到70%以上；
模型路由分层：简单请求用小模型，复杂请求用大模型，成本可以降低80%以上；
降级机制必备：大模型服务不可用的时候自动切换到传统脚本逻辑，保证玩家体验不中断；
全链路可观测：所有Agent的行为都要打日志，存储180天以上，方便排查问题；
策划可控：所有Agent的设定都要给策划提供可视化配置界面，不需要算法工程师参与就能修改。

5. 行业发展与未来趋势

5.1 技术发展历程

我们用一个表格来展示游戏AI和Agent Harness的发展历程：

时间范围	行业阶段	NPC技术	策划工具	测试技术	Harness技术发展
1990-2010	线性游戏时代	固定脚本、对话树	Excel配置、手动写剧情	纯人工测试	无，所有逻辑写死在引擎里
2010-2020	开放世界1.0时代	有限状态机、行为树	可视化剧情编辑器、数值配置工具	自动化测试脚本、猴子测试	简单规则引擎，约束NPC行为
2020-2022	小模型AI时代	小模型驱动的对话NPC	AI辅助生成剧情、数值推荐	AI辅助测试用例生成	专用AI中间层，对接小模型和游戏
2022-至今	大模型Agent时代	大模型驱动的智能Agent NPC	AI自动生成剧情分支、配置校验	测试Agent全自动测试	AI Agent Harness成为独立技术领域
2025-2030	全AI生成游戏时代	完全自主的智能NPC，动态生成世界	AI生成全量游戏内容，策划只需要提需求	测试完全自动化，从需求到上线全流程AI覆盖	通用游戏Agent Harness平台，中小游戏公司开箱即用

5.2 未来趋势与挑战

5.2.1 发展趋势

通用游戏Agent Harness平台会成为基础设施：未来会出现像Unity一样的通用Harness平台，中小游戏公司不需要自己开发，直接接入就能用AI Agent能力，成本降到原来的10%；
动态生成的开放世界成为主流：未来的游戏世界会完全由AI生成，每个玩家的游戏体验都是独一无二的，游戏的生命周期从1-2年变成5-10年；
AI会成为游戏策划、测试的标配工具：AI不会取代策划和测试，但是会用AI的策划和测试会取代不会用AI的，重复劳动会被AI替代，从业者会专注在更有创造力的工作上。

5.2.2 潜在挑战

体验平衡问题：怎么平衡AI的自由度和游戏的核心体验，不能让AI乱搞破坏游戏平衡；
成本问题：大模型的调用成本还是偏高，未来需要更高效的模型和优化技术把成本降到更低；
合规问题：AI生成的内容怎么保证符合监管要求，避免出现违规内容。

6. 本章小结

AI Agent Harness Engineering是连接AI Agent和游戏场景的核心中间件，它解决了AI Agent在游戏场景落地的可控性、延迟、成本、易接入四大核心问题，在智能NPC、策划提效、自动化测试三大场景都已经有成熟的落地方案，能给游戏公司带来70%的成本降低和30%以上的体验提升。未来3-5年，AI Agent Harness会成为游戏行业的标准基础设施，重构整个游戏产业的开发流程和玩家体验。

思考问题

你觉得未来的游戏会不会完全由AI生成？玩家的体验会有什么变化？
AI工具普及之后，游戏策划和测试的核心竞争力会变成什么？
你觉得AI Agent在游戏里还有哪些可以落地的场景？

参考资源

《2024年中国游戏产业AI应用报告》- 伽马数据
开源游戏Agent Harness框架：GameAgent Harness（https://github.com/gameagent/harness）
论文：《LLM-Powered NPCs for Open-World Games: Architecture and Best Practices》- 腾讯AI Lab 2024
课程：《AI Agent在游戏中的落地实战》- 网易游戏学院

（全文完，共计12800字）