Si vous êtes une grande entreprise amenée à gérer d’importants volumes de traduction, et ce dans plusieurs langues, vous aurez très certainement déjà été tenté par la traduction automatique. Certes, le besoin croissant en traductions dans des délais de plus en plus serrés nécessite d’automatiser cette activité intellectuelle, notamment en passant par la linguistique informatique ; mais c’est une solution que nous déconseillons vivement si elle ne s’accompagne pas d’une intervention humaine. Alors voyons ensemble comment fonctionnent ces systèmes afin de comprendre le rôle indispensable de l’« humain » dans une traduction.

Tout d’abord, les systèmes de traduction automatique font partie des solutions d’informatique appliquée à la linguistique qui englobe aussi les correcteurs orthographiques et les traducteurs intégrés dans les moteurs de recherche. Ils ont commencé à susciter l’intérêt des chercheurs avec la naissance de l’informatique, mais les premiers systèmes n’étaient guère efficaces en ce qu’ils effectuaient du mot-à-mot sans tenir compte ni du contexte, ni de la syntaxe ni d’autres règles qui entrent normalement en jeu dans une traduction que l’on pourrait qualifier de « manuelle », par opposition à la traduction automatique. Ces machines ne semblaient pas comprendre le texte de départ, et comment pourrait-on traduire sans comprendre ? Les chercheurs ont bien saisi l’ampleur de cette difficulté et les systèmes modernes sont désormais dotés d’un module d’analyse chargé de la compréhension et d’un module de génération pour la production. Le principe semble assez simple, vous en conviendrez. Mais les choses se compliquent lorsqu’on sait combien les langues sont ambigües et peuvent prêter à confusion (y compris pour les humains, alors imaginons le résultat avec des machines).

Voici quelques particularités linguistiques qui mettent en difficulté les systèmes de traduction automatique :

  1. Homographes

Les mots qui s’écrivent de la même manière sont une véritable source de problèmes pour une machine. En effet, prenons l’unité sémantique « vis », porteuse de plusieurs significations : l’outil qui serre à fixer une pièce mécanique ou, si l’on change de catégorie grammaticale, le verbe voir au passé simple. La machine se posera la question de savoir si « vis » est rattaché à un pronom « je », dans ce cas-là, il traduit l’expression comme un verbe ou si elle est suivie d’un article, il s’agira de l’outil. Certains termes sont beaucoup plus polysémiques et le système se trouve donc face à une multitude d’hypothèses face auxquelles il lui est difficile de prendre la bonne décision.

  1. Noms composés

En présence d’une expression figée contenant plusieurs termes, le système doit être capable de reconnaître le nom composé comme une seule et même unité de sens, sans aller traduire chacune de ses composantes. Voici le résultat fourni par le traducteur Bing pour l’expression figée « il pleut des cordes » :

BING

On observe que le système automatique est incapable d’utiliser l’expression consacrée : « It’s raining cats and dogs ». Vous n’êtes toujours pas convaincus que cette méthode peut vous causer beaucoup de tort ? Lisez la suite, et nous en reparlerons…

  1. Erreurs dans le texte source

L’exemple que nous venons de vous fournir n’est pas valable pour les systèmes de traduction automatique plus avancés. En effet, nous avons pu constater que les expressions idiomatiques du français vers l’anglais sont généralement bien traduites par Google Traducteur, mais attention… dès que l’on apporte une modification à l’expression, l’outil de Big G ne sait plus où il en est et nous donne une solution erronée. Nous avons donc demandé à cet outil de traduire l’expression « ce n’est pas la mer à boire » en y apportant volontairement une erreur d’orthographe « ce n’est pas la mère à boire » : dans ce cas, l’outil de traduction automatique nous propose une traduction des plus littérales : « it is not the mother to drink ». Si la phrase était passée entre les mains d’un traducteur qui utilise ses facultés intellectuelles et se pose des questions censées, il aurait immédiatement compris qu’il s’agissait d’une erreur. On se rend bien compte que la moindre erreur dans le texte de départ entraîne inévitablement une erreur dans le texte final… et ce n’est pas ce que vous attendez d’une traduction, n’est-ce pas ?

  1. Connaissances du monde

Il y a ensuite les cas de figure où le concept à traduire comporte une réelle ambigüité. Dans la vidéo d’une conférence intitulée « Linguistique et informatique : la traduction automatique », la professeur et chercheuse Laurence Danlos nous donne l’exemple suivant : « Zoe hit the carafe against the sink. It broke ». Le système a des difficultés pour identifier à quoi se rapporte le pronom personnel « it », mais notre bon sens et nos connaissances des lois physiques nous portent à penser que la carafe a plus de chances de se briser qu’un évier. Jusqu’à preuve du contraire, la « jugeote » est une qualité qui n’a pas encore été « implémentée » dans les systèmes de traduction automatique.

  1. Trous syntaxiques

Il nous faut ensuite parler des situations pour lesquelles l’une des langues de la combinaison présente des lacunes. C’est le cas notamment de la traduction depuis le japonais, une langue qui ne possède pas d’articles. Le système de TA suit le raisonnement suivant : pas d’article dans le texte de départ, pas d’article dans le texte cible… je vous laisse imaginer un texte qui serait rédigé dans un français dépourvu d’articles !

Je souhaiterais enfin rappeler que les langues évoluent à une vitesse grand V avec notamment l’émergence de nouveaux secteurs qui s’accompagnent de la création de nouveaux termes : tout bon traducteur se doit de consulter régulièrement les recommandations du Ministère de la Culture et de la Communication afin de se tenir à jour sur les dernières « tendances linguistiques ». Comment pourrait-on appliquer cette bonne pratique à l’informatique ?

La traduction automatique ne doit pas être utilisée seule, il faut l’accompagner d’un travail intellectuel propre à l’homme, comme pour la post-édition. De plus en plus d’entreprises optent pour cette solution qui consiste à faire traduire un texte par un système de traduction automatique et à le faire corriger par un linguiste de langue maternelle qui saura proposer un texte dans le génie de sa langue.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *