本地化
回到专栏主页
如何为游戏提供机器翻译
我们在之前的文章里围绕机器翻译(MT)展开了讨论,今天则要探讨如何将其运用于游戏本地化的流程当中。
机翻的主要优势在于节约成本、加快发布速度和开发新的语言或地区等,而其本身的劣势也在于输出的翻译质量。随着游戏玩家的体量和素质不断提升,高品质本地化的需求也越来越多。一款游戏的口碑时常会因为糟糕的翻译而受到影响,进而影响销量。因此对于开发和发行方来说,更重要的是以正确的方式将机器翻译集成到工作流程中,了解所有输出输入细节,并遵守一系列的基本规则来创建高质量内容。
我们的机翻流程采取了兼容并包的方式,能够基于具体案例具体分析的原则,为项目选用最佳的机翻系统方案。这让我们能为合作伙伴提供更快的周转时间、节省更多成本和保证数据安全。整个过程经过了验证和最佳实践,在过去几年的应用中不断优化,我们把这视作一个持续的演化过程,而质量始终是我们全程的目标。
高品质的翻译内容基于游戏前作的指引。如果能够拿出一份经过严格流程处理且得到认可的翻译,那么它就能成为日后项目的基础。适用我们机器翻译方案的游戏类型包括各各种游戏续作、MMO(包含迭代内容)、网游(拥有持续更新)以及类似的一些游戏。游戏行业重视基于独立内容打造的IP,而这对我们来说是一个建立强大翻译记忆库集(TM)、借此打造坚实可靠文本库的极佳机会。当一款IP的TM可用时,我们能基于初始游戏的文本,为以后的项目节省大量时间和精力。
目前有三种典型场景。
常备:我们会使用常备或普通MT引擎,并让PTW游戏语言专家后期编辑输出内容。此类型适用于当TM资源不充足而必须立即开始工作流程时选用。尽管如此,我们依然会在项目开始前启动可行性测试,确认提升速度不会造成品质流失。
半定制:在半定制流程中,我们将为常备或普通引擎搭配术语表,有时还会添加某些微调的规则。此类型适用于TM资源不充足,且必须立即开始工作流程时选用。这会是当可行性测试在常备引擎下达到临界标准时的一种解决办法。我们将始终遵循客户制定的术语和词汇。
完全定制:第三种类型是打造完全定制化的引擎。这可以在项目开始前或在标准翻译完成后进行,对于没有可用数据的游戏,还需要对三分之一的内容进行审核。
值得注意,PTW不会倾向于特定的引擎提供商;每个项目的实际需求才是哪个引擎最适合的判断标准。目前对于一些内容类型或用途, 我们暂时采用GPT-3作为实时翻译方案,从而解决NMT引擎低效高成本的问题。而这同样也是MT社群正在研究的方向。
最后一步是机器翻译后期编辑(MTPE)的最终检查。显然用于定制引擎的平行数据越多,MT也就能输出越好的效果。我们游戏语言专家需要作出的后期编辑量越少,意味着他们能够在更少时间内处理更多工作。
在流程中,我们同样会考虑到定制翻译引擎时遇到的问题。比如像英语到法语这样的语言上的翻译效果就会比其他更好;而德语到韩语则是一种典型的需要英语作为支点的翻译。
针对相应引擎的效力评估则是决定是否将运用于翻译工作的决定性因素。
小规模测试阶段为决策提供了一个严谨的框架。引擎的训练始于数据准备,将策划好的翻译记忆库和现有的术语表输入引擎,从而生成最终的MT系统应用程序。该MT应用程序将通过自动指标得分和人工评估进行评估。
人工评估包含A/B测试和评级等类型,如果时间紧张或者缺乏资源,但自动指标评分足够好,那么我们就会直接进行大量的后期编辑任务。通过这种策略,我们不仅能够在项目上取得实质性的进展,而且还能收集到宝贵的反馈以供MTPE参考之用(即所谓的编辑距离 评分)。我们的目标就是将其最终实装在CAT(电脑辅助翻译)工具之中。
但要明确,这些流程也并非最终的评断标准。比较众多的MT工具也同样是评估当中的重要部分。我们将评估不同引擎生成的结果,为项目选出最适用的引擎。引擎输出内容将进行一次后期编辑测试,从而比较后期编辑的效力并考量机翻文本的可用级别。
最终,我们将根据流畅度和准确性的评分对数据进行评估,备注主要错误类型,并针对相应语言,收集来自语言专家(深攻相应游戏领域或类型的专业翻译/后期编辑)的人工反馈。
以上步骤绝对不会脱离开发者和发行方独立运作。实际上,这项流程会在各方的协作之下运作。我们的合作伙伴会提供相关的准备内容并提出对于品质的预期要求,而PTW也会在适用的情况下提出适合项目的MT解决方案。合作还包括引擎定制和品质测试,使我们的方案能够满足项目的任何需求。开发商会分享工作流程,能让PTW拿出最好的整合方案,从而消除任何可能发生的效率问题。
PTW的语言学家已经借用神经机器翻译引擎进行了机翻后期培训。为了节省后期编辑中花费的时间精力,我们应用了一种叫做“APE”(自动后期编辑)的流程。APE包含了用于管理性别控制、修订、润色的规则以及其他后期处理技术,运用于目标MT输出内容后再发送给我们的语言专家。在提供风格指引或术语的情况下,我们会按照项目要求定制这些规则。当然,我们还能协助创建开发相关术语和风格指引,将其用于半/全定制MT引擎。
经过培训的后期编辑人员会提供成体系的反馈来持续改进MT引擎,包括参与项目的启动和收尾流程。虽然有时企业无法找到游戏专家作为后期编辑人员,但我们还是建议选择具有广泛语言风格经验(比如游戏内对话需要理解口语,常常属于影视剧视听翻译人员的必备能力)以及熟悉相应领域或类型(不过竞速游戏和街机游戏之间还是差别很大的)的翻译人员。和MT系统一样,最好为你的MTPE项目选择最佳的人力。
我们需要明确,机器翻译无法一蹴而就,而是一段任重道远的历程。这是一个需要日积月累,逐步完善的过程——我们需要给进步预留出充足的时间——这也是积累得出最佳结果的必经之路。尤其重要的是,请不要把MT当作一个一步到位的解决方案,因为MT输出内容是在目前为止仍需要持续的验证。
我们坚信耗费点时间精力在持续验证是非常值得的,因为这不仅能让合作伙伴们收获最高品质的内容,也能同时让作品更快地迈入市场。