Pages

vendredi 17 mars 2017

Histoire actualisée de la traduction automatique

À la lumière de la récente découverte d’un nouveau personnage clé dans l’histoire de la traduction automatique, j’ai pensé qu’il serait bon d’actualiser la « ligne du temps » de cette matière, autour des deux âges de la T.A. :

I. L’âge de fer : de la préhistoire au XXe siècle – Avant le Web 
II. L’âge d’or : XXe et XXIe siècles – Après le Web 

L’articulation sera la suivante :

I. De la préhistoire au XXe siècle – Avant le Web 

Trois grandes étapes :
  1. Le XVIIe siècle 
  2. Années 30 du XXe siècle : les précurseurs 
  3. Les 5 décennies suivantes 


1. Le XVIIe siècle

La « préhistoire » de la T.A. est essentiellement marquée par deux noms : René Descartes et Gottfried Wilhelm Leibniz, qui en jettent certaines bases conceptuelles.

Selon John Hutchins et Harold L. Somers, Descartes et Leibniz envisageaient à cette époque de créer des dictionnaires mécaniques en utilisant des codes numériques universels (« Both Descartes and Leibniz speculated on the creation of dictionaries based on universal numerical codes », in An introduction to machine translation).

Descartes nous en dit plus sur l’invention de la langue universelle dans sa correspondance :
Pour être vraiment telle, une langue doit naître de la « vraie » philosophie et donc procéder d’une réforme qui transpose dans les pensées le même ordre simple et naturel qui existe entre les nombres. Les pensées deviendraient alors claires et simples et il serait « presque impossible » de se tromper. Le premier pas à accomplir, précise Descartes, n’est pas d’inventer les mots primitifs et les caractères de la langue universelle, ni de garantir des temps rapides d’apprentissage, mais d’établir « un ordre entre toutes les pensées qui peuvent entrer en l’esprit humain, de même qu’il y en a un naturellement établi entre les nombres ». On pourrait alors inventer des « mots » et les ordonner comme on ordonne les langages inventés pour représenter les nombres et comme on apprend « en un jour à nommer tous les nombres jusqu’à l’infini, et à les écrire en une langue inconnue, qui sont toutefois une infinité de mots différents », et « faire le même de tous les autres mots nécessaires pour exprimer toutes les autres choses qui tombent en l’esprit des hommes ». Ainsi naîtrait une vraie langue universelle, puisque telle est la langue capable de représenter les pensées ordonnées dans l’esprit de l’homme, les idées simples. Une telle langue s’affirmerait « bientôt parmi le monde » et beaucoup seraient disposés à employer « cinq ou six jours de temps pour se pouvoir faire entendre par tous les hommes ».
La langue universelle ne peut donc naître qu’après avoir ordonné, distingué et énuméré les pensées des hommes de façon à les rendre claires et simples. C’est là « le plus grand secret qu’on puisse avoir pour acquérir la bonne science ». Reposant sur la connaissance des « idées simples », une telle langue deviendrait facile à apprendre, à prononcer et à écrire : « Et si quelqu’un avait bien expliqué quelles sont les idées simples qui sont en l’imagination des hommes, desquelles se compose tout ce qu’ils pensent, et que cela fût reçu par tout le monde, j’oserais espérer ensuite une langue universelle fort aisée à apprendre, à prononcer et à écrire, et ce qui est le principal, qui aiderait au jugement lui représentant si distinctement toutes choses, qu’il lui serait presque impossible de se tromper ».
Une langue universelle est donc une langue des pensées ordonnées, mais aussi des pensées claires et simples. Les mots dont les hommes disposent ne possèdent, au contraire, que des significations confuses, ce qui explique pourquoi on n’entend presque rien parfaitement.
Source : Lettre à Mersenne du 20 novembre 1629, B 24, p. 92-97. « La lettre a été étudiée, dans la littérature critique cartésienne, surtout par rapport au projet de langue artificielle, en y voyant même parfois un antécédent de la caractéristique universelle de Leibniz… »
in DESCARTES : TRADUCTION, VÉRITÉ ET LANGUE UNIVERSELLE
Giulia Belgioioso (Université de Lecce)

*

2. Années 30 du XXe siècle : les précurseurs 

Passons maintenant du début des années 30 au Web, c’est-à-dire du premier « traducteur mécanique » de Federico Pucci à la moderne « traduction automatique neuronale » :

1931 : Federico Pucci publie à Salerne la partie I de ce qui est vraisemblablement le premier ouvrage jamais publié sur un dispositif de "traduction mécanique" : « Le traducteur mécanique et la méthode pour correspondre entre européens, chacun en connaissant uniquement sa propre langue ». 


1932 : construction probable d’une première machine à traduire de Georges Artsrouni, détruite par la suite, aucun document la concernant n'ayant été conservé, si ce n’est une photographie ne permettant pas d'en donner une description. (Source)

1932 : Warren Weaver devient directeur de la Fondation Rockfeller

1933 : dépôt du brevet et présentation aux autorités soviétiques de la machine de Petr Petrovič Smirnov-Trojanskij, sans doute restée à l'état de plans et de description. (Source)


1933-1935 : construction du « cerveau mécanique » de Georges Artsrouni :


1935 : présentation du « traducteur mécanique » de Federico Pucci au Concours Lépine (?) (Source)

1937 : Georges Artsrouni présente quelques machines à l'Exposition Nationale de Paris, dont le principe fut couronné d'un diplôme de Grand Prix pour la mécanographie, selon l'inventeur lui-même.

1939-1945 : Deuxième Guerre mondiale

*

3. Les cinq décennies suivantes 
  •  La première décennie (≅1945-1955) : les premiers pas
  •  La deuxième décennie (≅1955-1965) : de l'enthousiasme à la déception 
  •  La troisième décennie (≅1965-1975) : la période calme 
  •  La quatrième décennie (≅1975-1985) : le réveil
  •  La cinquième décennie (≅1985-1995) : la maturité 
Inutile de répéter ici les développements de la T.A. selon la chronologie proposée en 1994 par Jacques ANIS dans « Ordinateurs et traduction : survol d'un demi-siècle » [In: Langages, 28ᵉ année, n°116, 1994. Le traducteur et l'ordinateur. pp. 111-122; doi : 10.3406/lgge.1994.1699], je renvoie le lecteur à la consultation du document source.

À noter que, selon l’auteur, il a essentiellement basé son travail sur le livre de John Hutchins (1986), intitulé « Machine Translation: Past Present Future », le même chercheur chez qui j'ai trouvé mention pour la première fois du nom de Federico Pucci. Or ce dernier a écrit au moins 12 livres sur les langues pendant 35 ans, dont 7 sur le "traducteur (dynamo-) mécanique", de 1931 à 1958, et apparemment, jusqu'à présent, il n'y a jamais eu nulle part aucune trace ni de l'inventeur ni de son invention, qu'il aurait pourtant présentée au concours Lépine ! Voilà bien des mystères que j'espère réussir à élucider...

La cinquième décennie chevauche enfin avec l’avènement du World Wide Web, à partir de 1990, année parfois considérée comme celle d'un renouveau de la T.A.

*

II. XXe et XXIe siècles – Après le Web 

Je dois encore développer cette partie, qui est sans aucun doute la plus riche (et donc il me faudra du temps, bien que j'aie déjà posé les premiers jalons), probablement selon l'articulation suivante :
  1. La décennie 1995-2005
  2. De 2006 à aujourd’hui
2006 coïncidant bien évidemment avec la montée en puissance du binôme Google et traduction automatique.

À suivre...



Liens connexes

Troisième partie (en italien) - Federico Pucci, pioniere della traduzione automatica
Quatrième partie - Premier texte au monde sur la traduction automatique




Aucun commentaire: