Montréal accueille un sommet de linguistique informatique.

Pendant toute une semaine, du 9 au 16 août prochain, le campus principal de l'Université de Montréal va devenir la capitale mondiale de la linguistique informatique. Sept à huit cent chercheurs et industriels de ce secteur y participeront à un double événement dont la simultanéité spatiale et temporelle est à lui seul un événement en soi.

C'est le Laboratoire de recherche appliquée en linguistique informatique (RALI) de l'université de Montréal qui accueille, cette année, la 17e Conférence internationale sur la linguistique informatique, COLING'98. Et, pour la première fois depuis 14 ans, le congrès annuel de l'Association for Computational Linguistics (ACL), principale association scientifique internationale dans cette discipline, se tiendra cette année au mêmes dates et au même endroit. Du coup, les deux événements n'en font qu'un, et un grand: COLING-ACL'98.

Qui plus est, cette rencontre historique sera le premier COLING nord-américain depuis 1984, année où l'Université Stanford avait également reçu ces deux événements simultanément. En l'an 2000, le COLING (une conférence biennale) se tiendra en Allemagne tandis que le Congrès annuel de l'ACL aura lieu en Asie.

Le RALI: une expertise reconnue

Le RALI est l'héritier direct du programme de recherche en traduction assistée par ordinateur (TAO) poursuivi depuis 1984 par le Centre d'innovation en technologie de l'information (CITI), un organisme fédéral dont l'abolition a été prononcé en octobre 1996 pour raisons de coupures budgétaires. Intégré au département d'informatique et de recherche opérationnelle (DIRO) de l'Université de Montréal l'année suivante, et subventionné par le Ministère de l'industrie du gouvernement canadien jusqu'en avril 1999, le RALI a pour mission de poursuivre et mettre en valeur ses précieuses recherches.

Les applications mises au point par le RALI couvrent plusieurs domaines de la traduction assistée par ordinateur et, plus généralement, de la linguistique informatique. Grâce à elles, le RALI a acquis une renommée internationale.

Deux d'entre elles – le système de réaccentuation automatique Réacc et Silc (dont la version commerciale est rebaptisée Qué?), un système d'identification de la langue et du codage – font l'objet d'une entente de commercialisation avec Alis Technologies.

Mais le coeur technologique développé par le RALI, c'est le projet TransX, fondé sur l'analyse en temps réel de gigantesques corpus de textes, véritable boîte à outils d'aide à la traduction professionnelle. L'un des plus achevés est le concordancier multilingue TransSearch. Fouillant en quelques secondes dans des milliers de phrases aux traductions appariées, il permet de trouver l'équivalent exact d'un très grand nombre de formes et d'expressions qu'aucun dictionnaire ne peut contenir intégralement.

Il est étonnant, par exemple, d'entrer dans l'interface de démonstration l'expression « dans les papates » et de constater que les équivalents anglais ne manquent pas: « away off track », « does not know what he is talking about », « out to lunch », « all wet », « completely off course », etc.

TransTalk est un autre outil qui effectue la transcription automatique d'une traduction dictée. Il se sert d'un modèle de traduction probabiliste pour améliorer la performance du module de reconnaissance vocale.

Moins achevé, mais très intéressant au plan commercial, Exibum est un extracteur d'information bilingue capable d'identifier de l'information bien précise d'un texte en langue naturelle et de la représenter sous forme structurée. À partir d'un rapport d'accident automobile, par exemple, il identifiera automatiquement la date, le lieu et le type d'accident ainsi que les informations relatives aux victimes. Ces informations pourront être stockées dans une base de données pour consultation ultérieure ou être utilisées pour générer des résumés.

Laboratoire recherche partenaires...

Mais devant le tarissement prochain de son financement institutionnel de source fédérale, le RALI devra se débrouiller dès l'an prochain avec les programmes de subventions classiques et le soutien du secteur privé. Patrick Andries, qui était encore récemment chez Alis Technologies, a donc rejoint cet été l'équipe dirigée par le Dr Pierre Isabelle pour prendre en main le développement des affaires.

Un labo comme le RALI, en effet, est suffisamment riche de savoir et de talent pour faire avancer la recherche fondamentale et mettre au point certaines applications. Mais il manque de ressources lorsqu'il s'agit de déployer ses technologies dans des dizaines de langues différentes. L'organisation du COLING-ACL'98 ne pouvait donc pas mieux tomber. Mettant en valeur l'excellence du RALI, il lui permettra sans doute d'initier de nouveaux partenariats.

   Pour en savoir plus:
Voir l'état de la TAO vu par le RALI dans la section Dossiers.
Une entrevue en RealAudio dans la nouvelle section Entrevues.
Le calvaire de l'organisateur du COLING vu par Martin Kay,
   chairman de l'ICCL (International Committee on
   Computational Linguistics) ;-D


Vidéos

Photos