[论文解读] Super Mario as a String: Platformer Level Generation Via LSTMs
作者训练 Long Short-Term Memory 网络通过将关卡视为瓷砖序列来生成《超级马里奥兄弟》关卡,探索八种数据表示,并展示包括玩家路径信息能够产生可玩、且类似人类的关卡。
The procedural generation of video game levels has existed for at least 30 years, but only recently have machine learning approaches been used to generate levels without specifying the rules for generation. A number of these have looked at platformer levels as a sequence of characters and performed generation using Markov chains. In this paper we examine the use of Long Short-Term Memory recurrent neural networks (LSTMs) for the purpose of generating levels trained from a corpus of Super Mario Brothers levels. We analyze a number of different data representations and how the generated levels fit into the space of human authored Super Mario Brothers levels.
研究动机与目标
- 通过从现有关卡中学习,推动平台跳跃游戏的程序化内容生成,而非手工规则;
- 研究如何将 2D 平台跳跃关卡表示为神经序列模型的一维序列;
- 评估不同数据表示对生成关卡的可玩性和质量的影响;
- 证明包括玩家路径信息可以提升关卡的可玩性并与人工编写的关卡更为一致;
- 提供跨多个维度将生成关卡与人工撰写关卡进行比较的指标。
提出的方法
- 使用具有 3 层、每层 512 个单元的 LSTM 来预测序列中的下一个瓷砖类型;
- 将关卡表示为瓷砖类型的序列(一种热编码)而非垂直切片,以提高泛化能力;
- 探索八种诱导的数据顺序(Bottom-To-Top 与 Snaking;带/不带 路径信息;带/不带 列深信息);
- 将一个 200 步的反向传播时序窗口并应用 dropout 以减少过拟合;
- 每五列递增一个特殊的列深度标记,以帮助网络捕捉关卡推进;
- 在 39 个经典 SMB 关卡(以及 SMB2)上训练网络,使用 70/30 的训练/评估分割,并使用负对数似然和其他可玩性指标进行评估。
实验结果
研究问题
- RQ1不同的 2D 平台跳跃关卡作为一维序列的不同表示,如何影响基于 LSTM 的生成?
- RQ2是否包含通过关卡的模拟路径或人类路径能提高可玩性,以及这在指标上的体现?
- RQ3哪种排序组合(Bottom-To-Top vs Snaking)、路径信息和列深信息能在真实感与可玩性之间达到最佳平衡?
- RQ4LSTMs 是否能够生成在特性(线性度、宽容度等)上与人工撰写关卡高度相近的关卡?
主要发现
- 最佳表现的数据格式为 Snaking-Path-Depth,在留出数据上的负对数似然最低;
- 包含路径信息显著提升可玩性,带路径的模型在评估中大约比不带路径的模型高出一倍左右;
- 所有带路径信息的生成器产生的关卡在路径长度和其他指标上与人工撰写的关卡一致,且带路径的变体实现的可玩性高于先前报告的 ML 基模型(可完成度高达 97%)。
- 带路径信息生成的关卡在多个指标上(线性度、宽容度、装饰、路径长度等)与原始 SMB 关卡的表达范围相匹配;
- 系统实现了 97% 的可完成关卡,超越先前的 ML 基模型(66%),并击败了此前竞赛中最佳的人工撰写系统(94%)。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。