Pages

vendredi 17 mars 2017

Histoire actualisée de la traduction automatique

À la lumière de la récente découverte d’un nouveau personnage clé dans l’histoire de la traduction automatique, j’ai pensé qu’il serait bon d’actualiser la « ligne du temps » de cette matière, autour des deux âges de la T.A. :

I. L’âge de fer : de la préhistoire au XXe siècle – Avant le Web 
II. L’âge d’or : XXe et XXIe siècles – Après le Web 

L’articulation sera la suivante :

I. De la préhistoire au XXe siècle – Avant le Web 

Trois grandes étapes :
  1. Le XVIIe siècle 
  2. Années 30 du XXe siècle : les précurseurs 
  3. Les 5 décennies suivantes 


1. Le XVIIe siècle

La « préhistoire » de la T.A. est essentiellement marquée par deux noms : René Descartes et Gottfried Wilhelm Leibniz, qui en jettent certaines bases conceptuelles.

Selon John Hutchins et Harold L. Somers, Descartes et Leibniz envisageaient à cette époque de créer des dictionnaires mécaniques en utilisant des codes numériques universels (« Both Descartes and Leibniz speculated on the creation of dictionaries based on universal numerical codes », in An introduction to machine translation).

Descartes nous en dit plus sur l’invention de la langue universelle dans sa correspondance :
Pour être vraiment telle, une langue doit naître de la « vraie » philosophie et donc procéder d’une réforme qui transpose dans les pensées le même ordre simple et naturel qui existe entre les nombres. Les pensées deviendraient alors claires et simples et il serait « presque impossible » de se tromper. Le premier pas à accomplir, précise Descartes, n’est pas d’inventer les mots primitifs et les caractères de la langue universelle, ni de garantir des temps rapides d’apprentissage, mais d’établir « un ordre entre toutes les pensées qui peuvent entrer en l’esprit humain, de même qu’il y en a un naturellement établi entre les nombres ». On pourrait alors inventer des « mots » et les ordonner comme on ordonne les langages inventés pour représenter les nombres et comme on apprend « en un jour à nommer tous les nombres jusqu’à l’infini, et à les écrire en une langue inconnue, qui sont toutefois une infinité de mots différents », et « faire le même de tous les autres mots nécessaires pour exprimer toutes les autres choses qui tombent en l’esprit des hommes ». Ainsi naîtrait une vraie langue universelle, puisque telle est la langue capable de représenter les pensées ordonnées dans l’esprit de l’homme, les idées simples. Une telle langue s’affirmerait « bientôt parmi le monde » et beaucoup seraient disposés à employer « cinq ou six jours de temps pour se pouvoir faire entendre par tous les hommes ».
La langue universelle ne peut donc naître qu’après avoir ordonné, distingué et énuméré les pensées des hommes de façon à les rendre claires et simples. C’est là « le plus grand secret qu’on puisse avoir pour acquérir la bonne science ». Reposant sur la connaissance des « idées simples », une telle langue deviendrait facile à apprendre, à prononcer et à écrire : « Et si quelqu’un avait bien expliqué quelles sont les idées simples qui sont en l’imagination des hommes, desquelles se compose tout ce qu’ils pensent, et que cela fût reçu par tout le monde, j’oserais espérer ensuite une langue universelle fort aisée à apprendre, à prononcer et à écrire, et ce qui est le principal, qui aiderait au jugement lui représentant si distinctement toutes choses, qu’il lui serait presque impossible de se tromper ».
Une langue universelle est donc une langue des pensées ordonnées, mais aussi des pensées claires et simples. Les mots dont les hommes disposent ne possèdent, au contraire, que des significations confuses, ce qui explique pourquoi on n’entend presque rien parfaitement.
Source : Lettre à Mersenne du 20 novembre 1629, B 24, p. 92-97. « La lettre a été étudiée, dans la littérature critique cartésienne, surtout par rapport au projet de langue artificielle, en y voyant même parfois un antécédent de la caractéristique universelle de Leibniz… »
in DESCARTES : TRADUCTION, VÉRITÉ ET LANGUE UNIVERSELLE
Giulia Belgioioso (Université de Lecce)

*

2. Années 30 du XXe siècle : les précurseurs 

Passons maintenant du début des années 30 au Web, c’est-à-dire du premier « traducteur mécanique » de Federico Pucci à la moderne « traduction automatique neuronale » :

1931 : Federico Pucci publie à Salerne la partie I de ce qui est vraisemblablement le premier ouvrage jamais publié sur un dispositif de "traduction mécanique" : « Le traducteur mécanique et la méthode pour correspondre entre européens, chacun en connaissant uniquement sa propre langue ». 


1932 : construction probable d’une première machine à traduire de Georges Artsrouni, détruite par la suite, aucun document la concernant n'ayant été conservé, si ce n’est une photographie ne permettant pas d'en donner une description. (Source)

1932 : Warren Weaver devient directeur de la Fondation Rockfeller

1933 : dépôt du brevet et présentation aux autorités soviétiques de la machine de Petr Petrovič Smirnov-Trojanskij, sans doute restée à l'état de plans et de description. (Source)


1933-1935 : construction du « cerveau mécanique » de Georges Artsrouni :


1935 : présentation du « traducteur mécanique » de Federico Pucci au Concours Lépine (?) (Source)

1937 : Georges Artsrouni présente quelques machines à l'Exposition Nationale de Paris, dont le principe fut couronné d'un diplôme de Grand Prix pour la mécanographie, selon l'inventeur lui-même.

1939-1945 : Deuxième Guerre mondiale

*

3. Les cinq décennies suivantes 
  •  La première décennie (≅1945-1955) : les premiers pas
  •  La deuxième décennie (≅1955-1965) : de l'enthousiasme à la déception 
  •  La troisième décennie (≅1965-1975) : la période calme 
  •  La quatrième décennie (≅1975-1985) : le réveil
  •  La cinquième décennie (≅1985-1995) : la maturité 
Inutile de répéter ici les développements de la T.A. selon la chronologie proposée en 1994 par Jacques ANIS dans « Ordinateurs et traduction : survol d'un demi-siècle » [In: Langages, 28ᵉ année, n°116, 1994. Le traducteur et l'ordinateur. pp. 111-122; doi : 10.3406/lgge.1994.1699], je renvoie le lecteur à la consultation du document source.

À noter que, selon l’auteur, il a essentiellement basé son travail sur le livre de John Hutchins (1986), intitulé « Machine Translation: Past Present Future », le même chercheur chez qui j'ai trouvé mention pour la première fois du nom de Federico Pucci. Or ce dernier a écrit au moins 12 livres sur les langues pendant 35 ans, dont 7 sur le "traducteur (dynamo-) mécanique", de 1931 à 1958, et apparemment, jusqu'à présent, il n'y a jamais eu nulle part aucune trace ni de l'inventeur ni de son invention, qu'il aurait pourtant présentée au concours Lépine ! Voilà bien des mystères que j'espère réussir à élucider...

La cinquième décennie chevauche enfin avec l’avènement du World Wide Web, à partir de 1990, année parfois considérée comme celle d'un renouveau de la T.A.

*

II. XXe et XXIe siècles – Après le Web 

Je dois encore développer cette partie, qui est sans aucun doute la plus riche (et donc il me faudra du temps, bien que j'aie déjà posé les premiers jalons), probablement selon l'articulation suivante :
  1. La décennie 1995-2005
  2. De 2006 à aujourd’hui
2006 coïncidant bien évidemment avec la montée en puissance du binôme Google et traduction automatique.

À suivre...



Liens connexes

Troisième partie (en italien) - Federico Pucci, pioniere della traduzione automatica
Quatrième partie - Premier texte au monde sur la traduction automatique




jeudi 16 mars 2017

Traduction automatique : une découverte extraordinaire

Il y a plus de dix ans sur ce même blog, je fus l'un des premiers à me pencher sur l'aventure de Google dans la traduction automatique, bien conscient qu'une révolution technologique était en cours ! Voir pour mémoire :
La décennie écoulée ne m'a pas démenti, au contraire, puisque nous en sommes maintenant à la "traduction automatique neuronale", un domaine qui mêle traduction automatique, cloud & big data, intelligence artificielle, deep learning et réseaux neuronaux, etc., et où se positionnent les mastodontes comme Google, naturellement, mais aussi Microsoft (article traduit automatiquement), IBM, Systran, voire demain Facebook, Apple et d'autres pointures. Tout cela ne sera pas sans conséquences, pour la traduction (écrite) autant que pour l'interprétation (orale). 

Or le futur n'est rien sans le passé, et l'histoire de la traduction automatique porte en elle les germes de ce qu'elle est en train de devenir aujourd'hui et de ce qu'elle sera demain. Il est donc important pour qui s'intéresse à la question de connaître les débuts de cette formidable aventure, que les chercheurs font généralement remonter en 1933 avec les travaux de deux ingénieurs précurseurs, MM. Petr Smirnov-Trojanskiy et Georges Artsrouni :
... it is nevertheless legitimate to recognise precursors in two patents submitted sixty years ago in 1933. One patent was issued in Paris on 22 July 1933 to Georges Artsrouni; the other was issued in Moscow on 5 September 1933 to Petr Petrovich Troyanskii. Both patents referred essentially to the construction of mechanical multilingual dictionaries.
Source : John Hutchins

Or comme je l'explique ici, ce même John Hutchins (University of East Anglia, Norwich, UK), mentionne dans deux autres documents un certain Federico Pucci :
In August 1949, the New York Times reported from Salerno that an Italian named Federico Pucci, had invented a machine to translate, saying that it would be exhibited at a Paris Fair; but no more was to be heard of it. 

Puis dans une seconde version mise à jour : 

On 26 August 1949, the New York Times reported (page 9) from Salerno: 
Federico Pucci announced today that he had invented a machine that could translate copy from any language into any other language. He said that the machine was electrically operated, but refused to disclose details. He said that he would enter it in the Paris International Fair of Inventions next month.  
It is uncertain whether Pucci had any knowledge of Huskey’s proposals, and it seems most unlikely he knew about Weaver's memorandum or the British experiments. In any event, there is no trace of any demonstration at the Paris fair; and nothing more is known about Pucci
[Corrected version (2005) of paper in: Machine Translation, vol.12 no.3, 1997, p.195-252] 
From first conception to first demonstration: the nascent years of machine translation, 
1947-1954 A chronology, by John Hutchins

Ainsi, ces deux seules indications et la magie d'Internet m'ont permis de découvrir l'histoire d'un autre inventeur historique de la traduction automatique et de son invention : un "traducteur mécanique" décrit dès 1931, soit deux ans avant le dépôt des brevets de MM. Smirnov-Trojanskiy et Artsrouni, devenu "traducteur dynamo-mécanique" en 1949. J'ai entrepris d'en raconter la saga ici :

Troisième partie (en italien) - Federico Pucci, pioniere della traduzione automatica
Quatrième partie - Premier texte au monde sur la traduction automatique

Or je ne sais encore rien de plus sur M. Federico Pucci et sur son invention, même si les éléments que j'ai réunis jusqu'à présent me laissent supposer :
  1. qu'il a d'abord présenté son "traducteur mécanique" (décrit en 1931) au concours Lépine 1935 ;
  2. qu'il a ensuite présenté la version de son "traducteur dynamo-mécanique" à ce même concours Lépine en 1949. 
Dans l'attente de recevoir les fichiers reproduisant certains de ses ouvrages, qui me permettront d'en savoir davantage sur ce "traducteur" mais aussi sur son inventeur, j'espère que la publication de ces billets ne restera pas sans effet !

Il y a encore beaucoup à découvrir...