« Ok google », « Dis, Siri », « Alexa »… Ces petits mots tendres font partie de notre quotidien. Il y a cinquante ans, parler à une machine de vive voix et qu’elle nous réponde dans un langage si naturel qu’on pourrait presque la confondre avec un humain, relevait de la science-fiction. L’INRS a la chance de compter dans ses rangs le très prolifique professeur Douglas O’Shaughnessy, qui est un des précurseurs dans le domaine de l’analyse de la parole et de ses applications avec les technologies.
Le jeune Douglas O’Shaughnessy a un intérêt marqué pour les sciences et les mathématiques et, avide de défi, il s’inscrit au Massachussetts Institut of Technology (MIT) pour ses études universitaires. Il y découvre l’informatique grâce aux ordinateurs de pointe présents sur place et excelle dans ce champ en pleine expansion. Studieux et infatigable, il obtient en même temps deux baccalauréats, un en mathématiques et un en génie électrique (ce qui se rapprochait le plus de l’informatique au début des années 1970). Pour poursuivre ses études supérieures, il cherche un champ d’investigation peu étudié et c’est ainsi, de manière fortuite, qu’il s’intéresse à l’analyse de la parole et au traitement de ses signaux. À la suite de sa maitrise et de son doctorat portant sur la production du langage et l’automatisation de son traitement, Douglas O’Shaughnessy choisit de devenir professeur-chercheur. Il entreprend des démarches pour trouver un poste.
À la même époque, l’INRS cherche à agrandir son équipe des Télécommunications et publie une annonce pour recruter un ou une professeur.e dans ce domaine. L’une des fonctions de cette personne sera de « Participer à un projet d’étude du système de transmission de la parole et plus particulièrement au codage, synthèse, analyse et connaissance de ces signaux. ». L’INRS reçoit plusieurs lettres qui ne tarissent pas d’éloges sur Douglas O’Shaughnessy, notamment de la part de son directeur de thèse et d’autres d’éminents professeurs du MIT. Il n’en faut pas moins pour que l’INRS rencontre le futur professeur et lui fasse une proposition d’emploi. À Montréal, Douglas O’Shaughnessy connaît deux confrères qu’il a cités dans ses travaux et voit, à travers l’offre de l’INRS, l’opportunité de pouvoir travailler avec eux. À l’été 1977, il débute en tant que professeur-chercheur à l’INRS – Télécommunications dont les locaux situés à Verdun sont partagés avec Recherches Bell Northern avec lesquels il mène plusieurs travaux de recherche au fil des années.
L’arrivée du nouvel enseignant se fait sans défi majeur : les laboratoires offrent tout le matériel et les logiciels dont il a besoin pour ses recherches. Même le contexte linguistique n’est pas un obstacle : il a obtenu une autorisation de l’INRS d’enseigner un quart de son temps à l’Université McGill, donc en anglais, ce qui lui laisse le temps d’apprendre et de gagner en aisance dans la langue de Félix Leclerc pour pouvoir enseigner à des étudiants francophones. Ses recherches ne sont pas affectées par la barrière de la langue puisque tous ses collègues sont bilingues ou anglophones et que les publications scientifiques se font en anglais.
Au fil des années, les recherches du professeur O’Shaughnessy vont s’articuler autour de plusieurs axes :
- le codage de la parole qui consiste à convertir un signal audio de la parole en un format numérique qui peut être stocké, transmis et traité par des systèmes informatiques.
- la synthèse de la parole c’est-à-dire faire produire de parole humaine à partir de texte à une machine. Cela implique la conversion de texte écrit en paroles prononcées de manière naturelle par un système informatique
- le rehaussement de la parole qui consiste améliorer la qualité et la clarté de la parole dans des environnements bruyants ou dégradés en supprimant les bruits indésirables et en mettant en évidence les signaux vocaux importants
- la reconnaissance de la parole, soit l’interprétation et la compréhension de la parole humaine par un système informatique à partir de signaux audios.
De ces travaux théoriques naissent de nombreuses publications et plusieurs projets, comme un logiciel de synthèse de la parole dont les droits sont acquis par des sociétés intéressées par le domaine.
Une des réalisations les plus notables est le LOQUAX, un appareil portatif produisant de la voix ou communément appelé ordinateur parlant dont le nom est le fruit d’un concours organisé à l’antenne de Radio-Canada fin 1984. Cet ordinateur sera même évoqué dans le journal des débats de l’Assemblé nationale du Québec en octobre 1986.
Pour son synthétiseur de la parole, le professeur O’Shaughnessy se voit attribuer le prestigieux 1er Prix international francophone innovation en matière d’Industries de la langue 1989, organisé par l’Agence de coopération culturelle et technique.
Il reçoit également le Prix de l’excellence de l’Université du Québec en 1988 récompensant ses travaux sur cette machine.
En 1987, l’INRS décerne ses 1èrs Prix d’excellence. Le professeur Douglas O’Shaughnessy est l’un des premiers récipiendaires pour une performance individuelle jugée exceptionnelle.
Dans le cadre d’un programme de réseaux de Centres d’excellence instauré par le Gouvernement fédéral, il reçoit les félicitations de l’administration de l’INRS pour l’excellence de sa recherche et son expertise scientifique concernant des travaux de recherche en collaboration avec l’Institut en robotique et en systèmes intelligentes dirigé par une entreprise Canadienne Precarn Associates Inc. Ces travaux portent sur l’interaction entre la machine et l’utilisateur grâce aux sons de la voix afin d’accroître les possibilités de la robotique. Les connaissances et l’expertise en reconnaissance de la parole et de la synthèse de la voix du Professeur O’Shaughnessy font de lui un partenaire de recherche de premier choix pour ce projet.
En parallèle, ses cours sur le traitement de la parole à l’Université McGill attirent des linguistiques, des psychologues ou encore des ingénieurs électriciens. Le professeur reçoit des évaluations très positives de la part de ses étudiants et il encadre plusieurs mémoires de maitrise. L’engouement pour son cours l’amène à rédiger en 1987 ce qu’il considère comme sa plus grande fierté : un livre portant sur ses recherches qui s’intitule Speech Communications: Human and Machine. Il estime que c’est le livre de base pour toutes les recherches qui sont produites dans le domaine du traitement de la parole. Le livre bénéficie d’une réédition en 1999.
Le professeur O’Shaughnessy est également nommé directeur des programmes d’enseignement en télécommunications à l’INRS en 1990. Il est toujours un membre actif de la communauté scientifique et il poursuit sa carrière à l’INRS où les projets ne manquent pas. Il travaille notamment à l’amélioration de la robustesse de systèmes de reconnaissance de parole automatique par une meilleure adaptation Il est également membre titulaire de l’Acoustical Society of America et de l’Institute of Electrical and Electronics Engineers.
Alors maintenant, quand vous poserez une question à votre cellulaire ou assistant personnel intelligent, vous saurez qu’il y a un peu de Douglas O’Shaughnessy en lui!
Ce texte a été rédigé par Mathilde Pottier dans le cadre de son stage en archivistique au SAGD.
Une partie des informations présentées dans ce texte découlenbt d’un entretien d’histoire orale enregistré auprès du professeur O’Shaughnessy en février 2024.