La traduction automatique, sous-produit de la guerre froide, est presque indissociable de l'histoire de l'informatique. «Pourtant, cela fait presque 40 ans que l'on prédit une percée imminente dans le domaine de la traduction automatique», les progrès technologiques ayant été «minimes». Et c'est un expert-conseil du domaine qui le dit!
John Chandioux, président de John Chandioux experts-conseils, auteur de plusieurs systèmes de traduction automatique, n'a pas étonné collègues et invités présents ce matin à un déjeuner-conférence organisé à Montréal par le Comité d'action pour le français dans l'informatique (CAFI). La traduction automatique pure n'existe pas encore, disait-il en substance.
Et les utilisateurs le savent bien: par exemple, quiconque expérimente le système Systran (le plus ancien, développé par l'armée américaine pour traduire le russe et aujourd'hui à l'oeuvre notamment dans le traducteur automatique du moteur de recherche AltaVista) se rend bien compte qu'il s'agit d'un outil de filtrage, pas d'un traducteur.
Alors, qu'est-ce qui est arrivé à la traduction automatique? «L'objectif initial était trop ambitieux: dans les années 60, on rêvait d'une machine à cracher des textes parfaitement traduits», a relaté John Chandioux. Espoirs déçus en 1966, la National Science Foundation des États-Unis concluant à l'impossibilité d'une traduction automatique fiable (ce qui a sonné le glas de la recherche dans ce domaine pour de nombreuses années).
Aujourd'hui, chercheurs et entreprises peinent à satisfaire la demande des consommateurs et des organisations, et de toute façon la traduction automatique ne concerne essentiellement que des textes techniques et scientifiques, à la signification peu ambiguë. Les annonces fracassantes d'entreprises de traduction assistée par ordinateur, à coups de millions$ en capital de risque, ne font qu'accroître «la confusion dans le grand public», a estimé John Chandioux.
Celui-ci a distingué quatre «tendances» en «t.a.» (comme disent les professionnels). Premièrement, les systèmes grand public que l'on retrouve sur le Web, qui peuvent nous donner une idée sommaire d'une page en chinois, par exemple ; «c'est légitime, mais ce n'est pas de la traduction automatique». Deuxièmement, il est possible d'adapter un système à un type de traduction donnée, mais cela se limite généralement à des textes et des phrases simples. Troisième tendance, traiter le problème à l'envers: «simplifier le langage de façon à rendre les textes plus intelligibles pour l'ordinateur», selon le conférencier. Enfin, quatrième tendance, renoncer tout simplement à la traduction automatique pour plutôt concevoir des outils informatiques d'aide aux traducteurs en chair et en os.
Coordonnateur du Laboratoire de Recherche Appliquée en Linguistique Informatique (RALI) à l'Université de Montréal, Elliott Macklovitch a présenté aux convives les tendances actuelles en recherche sur la traduction automatique. Les systèmes de deuxième génération, élaborés dès 1957, n'évoluent plus, soutenait le chercheur. «Il ne faut pas s'attendre à des percées spectaculaires», selon lui, car la traduction automatique contemporaine bute toujours sur des problèmes qui n'ont rien à voir avec la linguistique.
Elliott Macklovitch a rappelé qu'au début des années 90, la Defense Advanced Research Projects Agency (DARPA) du gouvernement américain, un des berceaux d'Internet, a subventionné un programme de recherche en traduction automatique qui opposait deux techniques: la traduction statistique (alors en oeuvre notamment chez les chercheurs d'IBM) et la traduction à base de connaissances (élaborée dans quelques universités américaines).
La première technique, où des calculs de probabilités d'usage de mots et de phrases remplacent les règles de grammaire, donne des résultats étonnants. Mais elle reste limitée, car les systèmes informatiques font abstraction de la signification des mots. Pour sa part, la traduction automatique à base de connaissance est peu utile, selon Elliott Macklovitch, car «il est impossible de formaliser toutes les connaissances nécessaires à la traduction, toute la culture d'un traducteur, ce qu'il a appris depuis sa naissance.» L'intelligence artificielle n'est d'aucun secours, car aucun système n'a de compréhension globale du monde. Et on en est encore là...
En somme, à l'orée du XXIe siècle et dans ce qu'on appelle l'«économie du savoir», un ordinateur ne peut traduire en français avec exactitude un texte aussi simple que «The glass fell on the table. It broke.» Le pronom neutre «It» désigne le verre ou la table? L'ordinateur ne peut déduire qu'il s'agit du verre, car il ne possède pas les références culturelles d'un être humain.
L'avenir de la traduction automatique résiderait dans la simplification des textes à traduire et dans la «mémoire de traduction» (mémorisation des phrases répétitives), a déclaré le consultant Jean Marguerat, pour qui Internet représente une opportunité à ne pas rater: «Le futur, c'est tout Internet ou intranet, avec des serveurs multilingues de traduction en ligne», qui intégreraient plusieurs techniques, puiseraient dans d'énormes ressources linguistiques, permettant le travail en équipe et réduisant la marge d'erreur dans les traductions.
Les industries de la langue sont devant un vaste chantier de construction. «Avec des investissements relativement modestes, le Québec pourrait prendre une place mondiale», affirmait Jean Marguerat.
Jean-Sébastien Marsan
Pour en savoir plus:
«La traduction automatique, 50 ans après» (Multimédium, 23 juillet 1998)
Le service InfiniT/Softissimo
Le site de l'entreprise Systran
Une entreprise québécoise très connue, Alis Technologies
Les entreprises en traduction automatique répertoriés dans Yahoo!
Bêtisier Web de traductions automatiques