Localisation
Retour au Labo
Comment utiliser la traduction automatique pour les jeux vidéo
Dans les articles précédents, nous avons discuté de ce qu’était la Traduction Automatique (TA), et maintenant cet article explique comment nous l’intégrons dans le processus de localisation des jeux.
L’intérêt essentiel pour la TA porte sur le fait qu’elle permet de réduire les coûts, de commercialiser les produits plus rapidement et d’explorer de nouvelles langues ou de nouveaux territoires. Le frein inhérent à ces aspects est, et avec raison, la qualité de la traduction produite. Cependant, avec l’augmentation du public de joueurs tant en volume qu’en sophistication, la demande pour des traductions plus qualitatives et précises s’est accrue. Une mauvaise traduction nuira à la réputation d’un jeu, et en conséquence, ses ventes baisseront. Aussi, est-il plus que jamais important pour les développeurs et les éditeurs d’intégrer correctement la TA à leur flux de travail, en étant conscients de tous les tenants et les aboutissants et en respectant quelques règles de base pour créer un contenu de qualité.
Notre processus de TA suit une approche indépendante des systèmes par laquelle nous déterminons au cas par cas quel sera le meilleur système de TA à utiliser pour un projet donné. Ceci nous permet de fournir les délais d’exécution plus courts, les économies de coûts et la sécurisation des données que nos partenaires exigent. Ce processus est une pratique éprouvée et optimale que nous avons peaufinée au cours de ses années de mise en œuvre. Toutefois, nous estimons qu’il s’agit d’un processus en constante évolution, dans lequel la qualité est toujours primordiale.
Notre guide de base pour la qualité commence par l’existence de contenu pour un titre précédent. S’il existe une traduction validée à partir de laquelle travailler, elle constituera une base solide sur laquelle bâtir tout projet, car elle aura déjà fait l’objet d’un processus rigoureux. Les projets les plus adaptés sont les suites de jeux, les MMO (car ils ont généralement un contenu itératif), les jeux en ligne (car leur contenu est, la plupart du temps, mis à jour en permanence) et les jeux similaires. Comme le secteur privilégie le développement de la propriété intellectuelle plutôt que le contenu autonome, il existe de nombreuses opportunités de créer de vastes collections de mémoire de traduction, (MT) lesquelles constituent des réservoirs de contenus validés. Lorsque la mémoire de traduction de la propriété intellectuelle peut être utilisée, cela permet un gain de temps et d’efforts considérable pour tout projet basé sur le jeu original.
Il existe trois scénarios types.
Générique : On utilise le moteur de TA générique ou de base et les linguistes PTW experts en assurent la postédition. On y fait appel lorsqu’il n’y a pas suffisamment de mémoires de traduction disponibles et qu’il faut démarrer la production immédiatement. Cependant, nous procédons toujours à un test de faisabilité au début d’un projet afin de vérifier que l’augmentation de la productivité n’entraîne pas de perte de qualité.
Semi-personnalisé : Dans le cas d’un flux de travail semi-personnalisé, le moteur générique ou de base est complété d’un glossaire, et il est possible d’ajouter certaines règles d’ajustement. On y fait appel lorsqu’il n’y a pas suffisamment de mémoires de traduction disponibles et qu’il faut démarrer la production immédiatement. Ce peut être une solution lorsqu’un test de faisabilité n’a obtenu que des résultats passables avec le moteur générique. La terminologie et le vocabulaire du client seront toujours respectés.
Entièrement personnalisé : La troisième possibilité est de construire un moteur complètement personnalisé. Cela peut se faire en amont du démarrage du projet ou en cours de route, une fois que la traduction standard est terminée, avec également une révision d’un tiers du contenu pour les jeux qui ne disposent pas au préalable de données utilisables.
Il convient de souligner que PTW ne privilégie aucun fournisseur de moteur de TA en particulier et que c’est en fonction des besoins de chaque projet que se fait le choix du moteur le plus adapté à la traduction en question. Actuellement, pour certains types de contenus ou à certaines fins, GPT-3 est envisagé comme solution de traduction en temps réel lorsque les moteurs de TA risquent d’être trop lents ou trop chers. Il s’agit d'une recherche en cours dans la communauté de la TA.
La dernière étape est celle de la postédition de la traduction automatique (MTPE) et de la révision finale. Bien entendu, plus l’on dispose de données parallèles pour personnaliser un moteur, meilleurs seront les résultats de TA. En réduisant les efforts de postédition, nos linguistes experts en jeu vidéo pourront traiter des volumes plus importants en moins de temps.
Au cours de ce processus, nous tenons compte de l’effort nécessaire pour personnaliser le moteur de traduction. Certaines combinaisons linguistiques - de l’anglais au français, par exemple -se traduisent mieux que d’autres ; l’allemand au coréen est un exemple de combinaison linguistique qui nécessiterait certainement l’anglais comme langue pivot.
L’évaluation de l’efficacité d’un moteur donné est un élément essentiel pour déterminer s’il convient de l’ajouter à la panoplie d’outils.
La phase de test pilote fournit un cadre rigoureux pour effectuer ce choix. Pour entraîner le moteur, il faut d’abord préparer les données et ensuite ajouter la mémoire de traduction et les glossaires existants à ce moteur, pour enfin procéder à l’application finale du système de TA. Cette application de TA sera examinée au moyen de mesures de scores automatiques et d’une évaluation humaine.
Le type d’évaluation humaine peut varier de tests A/B à une notation, et si le temps ou les ressources manquent, mais que les résultats des scores automatiques sont suffisamment encourageants, on pourra alors directement s’atteler à une tâche de postédition très lourde. Cette stratégie permet non seulement d’avancer sur le projet lui-même, mais aussi de recueillir des informations précieuses pour le processus de MTPE (à savoir le score de distance d’édition). L’objectif est de l’intégrer à terme dans un outil de TAO (traduction assistée par ordinateur).
Précisons que ces processus ne constituent pas l’arbitrage définitif. Les comparaisons d’outils de TA sont également un élément précieux de l’évaluation. Les résultats de plusieurs moteurs sont évalués afin de trouver le meilleur moteur pour un projet donné. Les résultats sont ensuite testés en postédition afin de comparer la productivité des post-éditeurs et d’évaluer dans quelle mesure le texte traduit automatiquement est utilisable.
Enfin, l’évaluation des données en termes de qualité peut impliquer la notation de la fluidité et de la justesse, l’annotation des principaux types d’erreur, et le recueil des commentaires de linguistes (traducteur·rice·s professionnel·le·s / post-éditeur·rice·s spécialistes du domaine ou du genre) pour la langue en question.
Rien de tout cela ne se fait à huis clos ou à l’insu du développeur et de l’éditeur. Au contraire, le processus implique une étroite collaboration entre toutes les parties concernées. Nos partenaires nous fournissent tout contenu existant pertinent et leurs attentes en matière de qualité, et PTW recommande la solution de TA la mieux adaptée au projet, le cas échéant. Cette collaboration comprend également la personnalisation du moteur et les tests de qualité qui feront en sorte que la solution réponde aux besoins du projet. Le développeur transmettra également son flux de travail afin que PTW puisse concevoir la meilleure intégration, ce afin de réduire tout risque de ralentissement potentiel.
Les linguistes de PTW ont été formés en postédition de la traduction automatique sur des moteurs de TA neuronale. Afin de réduire le temps et les efforts du processus de postédition, nous appliquons un processus appelé APE (post-édition automatique). L’APE englobe des règles de genre, de rédaction, de modération, et d’autres techniques de post-traitement appliquées au résultat de TA avant que les fichiers ne soient envoyés à nos linguistes. Ces règles sont adaptées aux exigences liées au projet lorsque des guides de style ou des glossaires sont disponibles. Bien entendu, nous pouvons vous aider à créer et à développer des glossaires et des guides de style adaptés qui seront exploités avec les moteurs de TA semi ou entièrement personnalisés.
Nos post-éditeur·rice·s sont formé·e·s pour apporter des retours structurés afin de continuer à améliorer le moteur de TA et il·elle·s participent à la mise en œuvre et à la clôture du projet. Bien qu’ils ne soit pas toujours possible de trouver des post-éditeur·rice·s qui soient des spécialistes des jeux, nous recommandons que vos traducteurs aient à la fois une grande connaissance du registre (par exemple, les dialogues en jeu peuvent nécessiter un langage familier, ce qui peut être une compétence de traducteurs audiovisuels qui ont travaillé sur des séries télévisées ou des films) et du domaine ou du genre (un jeu de course sera, bien entendu, différent d’un jeu d’arcade). Tout comme les systèmes de TA, il convient de choisir les meilleures ressources humains pour votre projet de MTPE.
Vous aurez compris à ce stade que nous considérons le processus de traduction automatique plutôt comme un marathon que comme un sprint. Il s’agit d’un processus qui se construit de lui-même, donc le perfectionnement constant - et, plus important encore, la nécessité de prévoir le temps de confirmer ces perfectionnements - est un élément nécessaire d'une méthodologie qui produit les meilleurs résultats au fil du temps. Il est important de ne pas voir la TA comme une solution de facilité, car les résultats de TA doivent être validés en permanence.
Nous pensons que les efforts et le temps que ce processus exige en valent bien la peine, car il nous permet de fournir à nos partenaires des résultats de la plus haute qualité tout en réduisant les délais de commercialisation.