ローカライズ
LABメインページに戻る
ゲームの機械翻訳を提供する方法
これまでの記事で、機械翻訳(MT)とはどんなものなのか説明してきました。今回は、MTをゲームローカライズの制作パイプラインに組み込む方法について説明します。
MTに向けられる一般的な関心には、主だったものとして、コスト削減、市場投入の迅速化、新しい言語や地域の開拓があります。こうした側面に内在する制限要因として、翻訳されたアウトプットの品質があります。しかし、ゲームのプレイヤー人口が増え、プレイヤーの目が肥えるにつれて、より良く、より正確な翻訳が求められるようになってきました。翻訳の質が悪いと、ゲームの評判が悪くなり、それに伴って売り上げも落ちることになります。そのため、デベロッパーやパブリッシャーにとって、MTを正しい方法でワークフローに組み込み、あらゆる点を把握し、いくつかの基本的なルールを尊重しながら、高品質のコンテンツを作成することがこれまで以上に重要です。
当社のMTプロセスは、システムに依存しないアプローチで、プロジェクトに最適なMTシステムをケースバイケースで決定します。これにより、パートナーが求める、より早い納期、コストの削減、データセキュリティを実現しています。このプロセスは、ここ数年の導入で磨きをかけた実績あるベストオブブリードですが、どんな時も品質を目標にしているため、継続的な進化であると考えています。
品質の基本的な目安を考えるときは、まず前作のコンテンツの有無から話が始まります。もし作業元になる承認済みの翻訳があれば、厳しいプロセスを経たものなので、その翻訳を基にプロジェクトを進めていくことができます。理想的なプロジェクトには、ゲームの続編、MMO(コンテンツが反復される傾向がある)、オンラインゲーム(コンテンツが継続的に更新される傾向がある)、および類似のゲームなどが含まれます。この業界では、単体のコンテンツよりもIPの展開が重視されるため、有効なコンテンツの宝庫である翻訳メモリ(TM)の強力なコレクションを作成する機会が十分にあります。IPのTMが使えるのであれば、その分、元のゲームをベースにして今後のプロジェクトにかかる時間と労力を大幅に削減できます。
3つの典型的なパターンがあります。
純正:純正または汎用MTエンジンを使用し、そのアウトプットをPTWのゲーム専門言語スペシャリストがポストエディットします。これは、利用可能なTMが十分でない場合で、すぐにでも生産性を上げたい場合に利用されます。ただし、プロジェクト開始時には必ず実現可能性テストを実施し、生産性の向上が品質の低下を伴わないことを確認します。
セミカスタマイズ:セミカスタマイズされたワークフローでは、純正または汎用エンジンに用語集が追加され、微調整ルールも加えられます。利用可能なTMが十分でない場合で、すぐにでも生産性を上げたい場合に利用されます。純正エンジンだけでは、実現可能性のテストの結果が微妙だった場合のソリューションになることもあります。クライアントの用語や語彙が常に尊重されます。
フルカスタマイズ:3つ目の可能性として、完全にカスタマイズされたエンジンを構築する場合があります。これは、プロジェクト開始前からでも途中からでも可能で、標準的な翻訳が完了した後、コンテンツの3分の1を過去の使用可能なデータがない状態で見直すことになります。
PTWは、特定のエンジンプロバイダを支持するということはなく、プロジェクトのニーズごとに、どのエンジンが翻訳に最も適しているかを判断します。現在、コンテンツの種類や目的によっては、NMTエンジンの処理速度が遅かったり、コストが高かったりするため、リアルタイム翻訳ソリューションとしてGPT-3が研究されています。これは、MTのコミュニティで現在進行中です。
最後に、機械翻訳ポストエディット(MTPE)と最終確認が必ず行われます。当然ながら、パラレルデータを使ってエンジンをカスタマイズすればするほど、MTのアウトプットの質は向上します。ゲームに精通した言語スペシャリストによるポストエディット作業の負荷が軽減されるため、より多くの量をより短時間で処理できるようになります。
この作業の間、翻訳エンジンのカスタマイズにかかる手間も考慮されます。英語とフランス語のように、ある種の言語ペアは他の言語ペアよりも翻訳しやすく、ドイツ語と韓国語は、おそらく最も英語を軸にする必要がある言語ペアの例です。
エンジンの有効性の評価は、ツールのベンチマークに加えるかどうかを判断する上で重要になります。
パイロットテストの段階では、その判断を下すための厳密な枠組みが提供されます。エンジンのトレーニングは、データ準備から始まり、厳選されたTMや既存の用語集の送り込み、最終的なMTシステムの適用まで続きます。このMTの適用は、自動メトリックスコアと人間による審査で評価されます。
人間による審査はA/Bテストからレーティングまで様々で、時間がなかったりリソースが不足していても、自動メトリックスコアが有望と出た場合は、そのまま重厚ポストエディット作業に直接進めます。この戦略を使えば、実際のプロジェクトを進められるだけでなく、MTPEコンサルティングのための貴重なフィードバックも収集できます(つまり編集距離スコア)。最終的な目標として、CAT(コンピュータ支援翻訳)ツールへの展開を目指しています。
誤解のないように言うと、これらのプロセスが最終的な判断材料になるわけではありません。また、MTツール同士の比較も評価の重要な要素です。複数のエンジンから得られた結果を評価し、プロジェクトに最適なエンジンを特定します。アウトプットにはポストエディットテストが行われ、ポストエディターの生産性が比較され、機械翻訳された文章の使いやすさが検討されます。
最後に、品質に関するデータの評価には、流暢さと正確さの評価、主なエラータイプに対する注記、指定された言語の人間の言語スペシャリスト(指定された分ややジャンルを専門とするプロの翻訳者/ポストエディター)からのフィードバックの収集が含まれます。
こうした作業は、いずれも隔離された状況で行われるものではなく、またデベロッパーやパブリッシャーが全く無関係な状態で行われるわけでもありません。実際、この作業には、関係者の協力が不可欠です。パートナーから関連する過去のコンテンツや期待する品質が提供され、PTWはプロジェクトに最適なMTソリューションがあれば、それを推奨します。この協力には、ソリューションをプロジェクトのニーズに適合させるためのエンジンのカスタマイズや品質テストも含まれます。また、デベロッパーがワークフローを共有することで、PTWが最適な組み込みを設計することができ、そうしない場合に発生する可能性のある遅延を緩和できます。
PTWの言語スペシャリストは、ニューラル機械翻訳エンジンによる機械翻訳ポストエディットの訓練を受けています。こうしたポストエディットの手間を軽減するために、「APE」(自動ポストエディット)と呼ばれる作業が適用されます。APEには、ジェンダーコントロール、改訂、モデレーションなど、言語スペシャリストにファイルを送る前にターゲットMTのアウトプットに適用される後処理技術を管理するルールが含まれています。こうしたルールは、スタイルガイドや用語集がある場合は、プロジェクトの要件に合わせてカスタマイズされます。もちろん、当社は、セミカスタマイズやフルカスタマイズされたMTエンジンで利用する用語集やスタイルガイドの作成もお手伝いします。
当社のポストエディターは、MTエンジンを改善し続けるために構造化されたフィードバックを提供する訓練を受けており、プロジェクトの立ち上げと終了に携わります。ゲームの専門家とポストエディターは違うこともあるでしょうが、翻訳者の場合、登録内容(例えば、ゲーム内のセリフには口語が必要な場合があり、テレビシリーズや映画の翻訳を担当したオーディオビジュアル翻訳者の略歴に記載される要素である)と、分野やジャンル(レースゲームは当然ながらアーケードゲームと違う)の両方で幅広い経験を持つことが望まれます。MTシステム同様、MTPEプロジェクトでも最適な人材を選定する必要があります。
ここまで来れば、私たちが機械翻訳のプロセスを短距離走ではなく、マラソンとして理解していることが分かると思います。それ自体が積み重なるプロセスであるため、常に改良を加え続けること、そして、より重要なこととして、その改良を確認するために必要な時間を考慮することが、時間をかけて最良の結果を生み出すために必要なのです。MTのアウトプットには継続的な検証が必要であるため、MTをソリューションとして簡単に考えないことが大事です。
この作業にかかる労力と時間は、投資に見合うものだと考えています。なぜなら、市場投入までの時間を短縮すると同時に、パートナーに対して最高品質のアウトプットの提供を実現できるからです。