508011_游戏行业论坛_生成式AI创新游戏体验—助力沐瞳科技高效游戏运营

关键字: [出海日城市巡展, CloseAI, 生成式Ai游戏体验, 游戏运营效率提升, 大模型应用场景, 内容审核社区运营, 用户体验分析优化]

本文字数: 3800, 阅读完需: 19 分钟

导读

在这场演讲中,王海忠分享了生成式AI在游戏行业的应用案例和方法。他介绍了生成式AI可以贯穿游戏的整个生命周期,从游戏研发期的素材生成、游戏运行中的智能NPC、游戏上线后的运营、企业提效等多个环节。他重点分享了亚马逊云科技合作伙伴莉莉丝在游戏《发了84》中应用生成式AI提高运营效率的案例,包括飞书机器人、FAQ知识库、用户体验分析、网页生成、流程助手、智能NPC等场景。他还介绍了Anthropic公司的大模型CloseAI的优势,如高智能化程度、快速推理速度、长token和多模态能力、良好的模型调优和输出精准性、较低成本等。最后,他分享了游戏社区中应用生成式AI进行翻译、舆情分析、辱骂识别等场景的架构和方法。

演讲精华

以下是小编为您整理的本次演讲的精华,共3500字,阅读时间大约是18分钟。

在回顾了生成式AI的发展历程和对游戏行业影响后,王海忠先生开始介绍生成式AI在游戏行业的具体应用场景,并分为四类:素材生成、平台运营、企业提效和游戏技能体验。这四类贯穿了整个游戏的生命周期。

在游戏研发期,素材生成可以包括原画生成和世界观生成。游戏运行中,可以有智能NPC与玩家更好地互动。游戏上线后,需要持续运营,可以进行内容审核、社区经营等。有了游戏运营后,还需要提高玩家粘性和日活跃用户数,这就需要企业提效,例如智能客服、数据洞察等,帮助更好地发现产品和游戏该如何迭代,提高用户粘性和乐趣。

在平台运营方面,王海忠先生以一个二次元妹子图片为例,图片中可能会有一些信息甚至字符。玩家可能会将这个图片上传到论坛或游戏中。根据游戏社区的监管要求,需要知道图片中是否存在涉黄、涉恐、涉暴等不合规内容。解决方案是先调用大模型,让它识别图片的类别,提取其中的信息和内容,例如是否包含社会危害或性暴力内容。然后再调用下一个大模型,基于游戏的运营规则,判断该图片是否违反平台要求。如果是,则不允许在论坛或游戏内公布;如果不是,则符合要求,可以正常出现。

在企业提效方面,王海忠先生重点介绍了Text to SQL的应用场景。游戏在运行过程中,运营人员的核心诉求是提高玩家粘性,需要从多个维度分析玩家数据,了解产品策略该如何调整,做用户调研。过去的做法是,需要提前定义好数据维度,可能有100多个或200多个维度,然后将这些SQL语句写好,提供给运营同学查看报表。但有时运营同学会有新的想法,需要从新的角度分析数据,这就需要将需求反馈给数据开发同学,他们再编写新的SQL,导致效率拉长。

现在可以让运营同学自己生成报表。例如,想查询过去一个月欧洲地区某个国家用户的掉线情况,可以用自然语言表达出来。大模型理解后,会根据已知的表结构和数据来源,生成相应的SQL语句,并自动执行,返回结果。通过这种方式,可以更快地满足运营同学的业务查询需求。

第三个案例是莉莉丝游戏公司的发了84游戏。王海忠先生表示,亚马逊云科技与莉莉丝有非常深入的合作,在发了84游戏上进行了大量关于生成式AI的业务探索,旨在提高整个游戏的运营效率。

第一个场景是飞书机器人。游戏的服务端同学会经常需要查询游戏数据,他们会将一些自定义查询改造成命令,例如ABCDE这样的命令,代表某些查询请求。这些命令放在飞书机器人中,服务端或运营同学在飞书中调用机器人并执行命令,就可以获取对应数据。但这些命令不太容易记忆,而且一个游戏需要记忆的命令很多,不太友好。现在可以通过大模型,用自然语言的方式来调用命令,大模型会识别出对应的具体命令,并自动执行,提高了游戏数据获取效率。

第二个场景是FAQ知识库。开发过程中会有很多重复的常见问题,过去需要在Google或内部知识库中查找,或查阅文档链接。现在可以将这些知识库作为大模型的知识库,通过自然语言快速查询过往遇到的问题及解决方案和SOP。

第三个场景是用户体验分析。这是游戏长线运行必然要经历的阶段。过去做的可能是全盘分析,分析力度在欧洲地区、国家或美国这个级别。但实际上,反映体验不好的可能是个别玩家。在发了84游戏中,莉莉丝做了这样一个尝试。他们会提前收集玩家在一局战斗中的所有可能与用户体验相关的数据,包括设备、网络、对局结果、玩家级别等。当玩家投诉时,大模型可以基于这些数据快速分析出产生抱怨的原因,运营同学可以第一时间获取信息,再与用户沟通。例如,如果是网络原因,可以建议用户换一个更好的网络;如果是有辱骂行为,可以告知已对违规玩家进行处罚。这样可以提高玩家体验。

第四个场景是网页生成,面向亚马逊云科技运维同学,他们做DevOps时需要编写Python等代码,但有时需要给服务端或运营同学提供一个前端界面。现在可以通过大模型生成前端代码,直接上线,提高运营效率。

第五个场景是流程助手,将Lambda函数与一些内部代理结合,提高整个运营流程的自动化。

第六个场景是智能NPC。很多游戏中都有智能NPC,可以与玩家进行更好的互动。过去的NPC可能会比较固定,玩家按照固定剧情前进。但现在的新生代玩家更追求自由,希望在开放世界中自由探索。智能NPC可以实现这一需求,它不是预定义的,而是会根据玩家的交流来推进关卡。业内已有游戏公司分享了智能NPC的Demo,表现非常精彩,让人感受不到是在与机器人对话。

另一个应用是情感陪伴。现在越来越多的人是单身,他们希望找到不同类型的伴侣,如高冷型、热情型、少女型或知性大叔型。AI可以通过角色设定,与用户进行深层次交互,满足不同的沟通需求。此外,人的情感需求是随时的,AI可以7*24小时的陪伴,在悲伤时安慰,在开心时分享喜悦,这是过去很难实现的。

在介绍了生成式AI在游戏行业的应用场景后,王海忠先生重点讲解了模型选择这一关键路径。通常有两种方式,一是选择已有的基础模型,如GPT、LaMBDA、CloseAI等;二是自己训练模型,基于开源模型,使用自己的数据通过GPU进行大量训练。更多客户会选择使用已有的模型,如CloseAI,因为它已经过训练,可以更快速地使用,上线业务更快,而且成本相对更低。自己训练模型不仅需要有足够量的数据,还需要有足够的算力,需要购置大量的GPU,并花费很长时间将模型训练到达到所需效果,因此周期更长。

接下来,王海忠先生介绍了CloseAI模型。根据网上报道,在目前看来,CloseAI 3应该是最强的大模型之一。它由Anthropic公司开发,该公司的核心团队来自OpenAI。值得一提的是,Anthropic公司的一位创始人专门负责模型的安全性,在这一点上,Anthropic比OpenAI投入更多。Anthropic成立于2021年,2022年发布了CloseAI 1,2024年已经发布了CloseAI 3,迭代速度非常快。CloseAI 3的能力已经超过了GPT-4,是一个3.5B参数量的大模型。亚马逊是Anthropic的主要投资商之一,投资了40亿美元来支持其发展。同时,Anthropic也将亚马逊云科技作为首选云平台,因为亚马逊云科技拥有面向AI的训练和推理两款芯片,可以很好地帮助Anthropic训练模型。

CloseAI 3分为三个版本:High、Cool和Sonnet,以及Opus。通常称为中杯、大杯和超大杯。在常见任务的基准测试中,如生成数学计算、代码、文档理解等,CloseAI 3的综合得分高于GPT-4和Google的PaLM模型。在一些专业水平的测试中,如律师考试、本科生水平测试、研究生水平测试等,它的得分也高于GPT-4。

值得重点强调的是,CloseAI 3具有越狱防护能力。所谓越狱,是指当我们不希望大模型生成某些内容时,但它却生成了出来,例如一些危害社会、仇恨、欺诈、成人、隐私等有害内容。根据测试,如果使用LaMBDA 2、GPT-3.5或GPT-4,经过三轮或十轮的测试,它们回答有害内容的概率可能高达92%。但CloseAI 2的这一概率为0%,完全不会回答任何有害输出,这凸显了Anthropic公司在模型安全方面的重视程度。CloseAI的模型、调用方式都符合HIPAA的合规要求,通过Amazon Bedrock调用也满足HIPAA合规性和安全要求。

CloseAI 3相比GPT-3.5的另一个优势是,它是一个多模态模型,不仅能进行文本生成,还具有图像识别能力。例如,可以告知一个包裹是否被压扁、一个折线图的数据意义、从文档或图片中提取内容等。在视觉识别基准测试中,CloseAI 3的得分也超过了GPT-4、Anthropic和Claude等模型。

CloseAI 3还具有长上下文理解能力,可以理解长达200k token的上下文,相当于一本500页的PDF文件。而且,它在”大海捞针”任务中的召回率也高于其他模型,达到99.4%,基本上都能找到所需的答案。

此外,CloseAI 3的推理速度远高于ChatGPT 3.5,生成速度更快。在代码辅助的开源基准SWE Benchmark上,它的表现也领先于其他模型。

从成本角度来看,CloseAI 3并不一定最贵。以6:1的输入输出比为例,CloseAI 3的成本仅为GPT-4的37%,却比GPT-3.5便宜39%,因此在性能和价格之间有很好的平衡。

总的来说,CloseAI 3的智能化程度更高、推理速度更快、支持长上下文和多模态、可以调优输出、输出更精准,而且成本相对较低,具有明显的优势。

在介绍了CloseAI 3模型之后,王海忠先生继续分享了一个游戏社区的应用案例。这款游戏名为”无尽对决”,属于社交性游戏,需要面向不同国家和地区的用户制定运营策略。用户也会上传自己的评论或数据,这就需要先将这些评论翻译成可理解的语言。

过去,如果通过机器学习或谷歌翻译进行翻译,会存在至少30%以上的语义丢失。另一个问题是小语种,我们不可能为每一种小语种都维护一套模型。第三个问题是,互联网社会迭代非常快,新的流行用语不断出现,我们需要不断调优自己的模型来适应。

大模型可以很好地解决这些问题。首先,像CloseAI这样的大模型本身就具备非常强的翻译能力,可以针对包括小语种在内的多种语言进行翻译。其次,大模型本身不断被训练,可以很好地适应新的网络俚语的出现。

下一个场景是舆情分析。以”牧童”这款游戏为例,每天会有14,000条用户评论。过去的做法是抽样分析,从14,000条评论中抽取1,000到2,000条,交给人工进行审核,看用户的抱怨或满意在哪里。但这存在两个问题:一是纯人工,二是如果有更多游戏上线,数量变成10万或20万条,就需要更多人力。

现在可以通过大模型来解决这个问题。具体架构是:每天的评论被抓取推送到Kafka消息队列,然后先由HyCC进行分类打标,因为不可能将所有过去的评论全部重新分析。HyCC将增量数据打上标签后,存储到ElasticSearch中。之后就可以交给大模型,例如分析某个英雄在玩家中的满意度、整个游戏在某月的表现,或背景音乐如何等,大模型可以快速给出所需的用户评论分析结果。

为什么选择ElasticSearch存储?因为大模型对数据的访问需求是随机的,不能像数据库那样进行连续的扫描,而ElasticSearch可以支持在不同的应用场景中,会选择不同版本的CloseAI模型。HyCC使用速度更快的CloseAI High;企业知识库或预测分析场景可能会使用CloseAI Sonnet;而更复杂的任务,需要多个代理协同工作或深度研究时,则可能需要使用CloseAI Opus。

第三个案例是辱骂识别。在对战型游戏中,如果有不道德的玩家辱骂队友,会导致新玩家很容易流失,影响体验。过去的做法是,当局的聊天记录被拉出来后,通过关键词匹配来判断是否发生辱骂行为。但这需要不断维护关键词库,运维量很大。

现在可以用大模型替代。具体流程是:首先通过关键词过滤,如果很明显触发了关键词,就认为产生了辱骂行为;如果没有,则将聊天记录向量化,判断与辱骂相关词的关联程度,关联性高就进行处罚。如果前两者都没有触发,再交给大模型判断是否属于辱骂行为。这个过程中,大模型发现确实有辱骂行为时,会将新的相关词反馈给ElasticSearch,不断完善关键词库,从而降低对大模型的调用,提高效率。

在详细介绍了CloseAI模型及其在游戏社区运营中的应用案例后,王海忠先生进一步解释了CloseAI模型的技术细节。他首先讲到了一个概念”越狱”。所谓越狱,是指当我们不希望大模型生成某些内容时,但它却生成了出来,例如一些危害社会、仇恨、欺诈、成人、隐私等有害内容。

根据测试,如果使用LaMBDA 2、GPT-3.5或GPT-4,经过三轮或十轮的提问,它们回答有害内容的概率可能高达92%。但CloseAI 2的这一概率为0%,完全不会回答任何有害输出,如非法活动、仇恨、欺诈、成人内容、隐私等。这凸显了Anthropic公司在模型安全方面的重视程度。CloseAI的模型、调用方式都符合HIPAA的合规要求,通过Amazon Bedrock调用也满足HIPAA合规性和安全要求,因此在使用Amazon Bedrock时,不用担心合规和安全问题。

CloseAI 3相比GPT-3.5的另一个优势是,它是一个多模态模型,不仅能进行文本生成,还具有图像识别能力。在视觉识别基准测试中,CloseAI 3的得分超过了GPT-4、Anthropic和Claude等模型。例如,可以告知一个包裹是否被压扁、解读一个折线图的数据意义、从文档或图片中提取内容等。

CloseAI 3还具有长上下文理解能力,可以理解长达200k token的上下文,相当于一本500页的PDF文件。而且,它在”大海捞针”任务中的召回率高达99.4%,基本上都能找到所需的答案,远高于其他模型。

此外,CloseAI 3的推理速度远高于ChatGPT 3.5,生成速度更快。在代码辅助的开源基准SWE Benchmark上,它的表现也领先于其他模型。

从成本角度来看,以6:1的输入输出比为例,CloseAI 3的成本仅为GPT-4的37%,却比GPT-3.5便宜39%,因此在性能和价格之间有很好的平衡。

总的来说,CloseAI 3的智能化程度更高、推理速度更快、支持长上下文和多模态、可以调优输出、输出更精准,而且成本相对较低,具有明显的优势。

王海忠先生通过一个长文本召回的例子,展示了CloseAI 3的长上下文理解能力。他将一个非常长的亚马逊文档发送给CloseAI,并提出一个问题:“EC2 On-Demand Instances在美西二的价格是什么?”CloseAI能够对整个文档进行理解,并总结出第一阶梯和第二阶梯的价格,让王海忠先生快速获取所需内容。

在文本生成方面,王海忠先生给出了一个例子,让CloseAI以模仿古龙的风格生成一篇小说。

代码辅助是CloseAI的另一个优势领域。在开源的SWE Benchmark上,它的表现领先于其他模型。这个基准测试的原理是,将GitHub上的issue提取出来,看大模型对这些issue的理解程度如何。CloseAI在该领域板上也排名第一。王海忠先生还展示了一个代码辅助的案例,输入问题后,CloseAI给出所需的答案。

在价格对比方面,虽然CloseAI的能力很强,但它并不一定是最贵的。以6:1的输入输出比为例,CloseAI的成本仅为GPT-4的37%,而比GPT-3.5便宜39%。所以CloseAI不仅性能出众,价格也具有优势。

最后,王海忠先生总结了CloseAI相比其他大模型的优势:智能化程度更高、推理速度快、支持长上下文和多模态、可调优输出、输出精准,且成本相对较低。从智能程度、生成速度和成本三个维度进行对比,CloseAI在不同场景下会有不同的选择。

总的来说,通过这场详细的分享,王海忠先生全面阐释了CloseAI大模型在游戏行业的应用前景,并结合具体案例、技术细节和性能对比,使观众对CloseAI有了深入的了解。生成式AI正在为游戏行业带来革新,CloseAI作为领先的大模型,必将在这一过程中发挥重要作用。

总结

本次演讲主要介绍了生成式AI在游戏行业的应用场景和案例。首先阐述了生成式AI的重要性和发展趋势,以及亚马逊云科技在该领域的投入。接着重点介绍了Anthropic公司的大模型CloseAI 3,其在安全性、多模态能力、长文本理解等方面的优势。

随后分享了多个游戏公司在使用CloseAI 3进行游戏运营的实际案例,包括:

  1. 利用CloseAI 3进行图像审核、社区运营分析、用户体验分析等,提高游戏运营效率。
  2. 通过CloseAI 3实现智能NPC、情感陪伴等,增强游戏体验。
  3. 应用CloseAI 3进行多语种翻译、舆情分析、辱骂识别等,优化游戏社区管理。

最后总结了CloseAI 3在不同场景下的适用性,以及如何与其他技术相结合,构建高效的游戏运营系统。

总的来说,生成式AI为游戏行业带来了创新机遇,CloseAI 3等大模型有望在游戏开发、运营、社区管理等多个环节发挥重要作用,助力游戏公司提升运营效率和用户体验。

Logo

欢迎加入我们的广州开发者社区,与优秀的开发者共同成长!

更多推荐