Flux RSS
Disponible depuis le 18 octobre en français, l'ouvrage "L'apprentissage Profond" est LE livre de référence du domaine (la version anglaise est sortie en 2016 aux éditions MIT Press). Véritable prouesse : la traduction française a été entièrement effectuée par des outils d'intelligence artificielle, et justement par l'apprentissage profond (deep learning )... Quel devenir pour les traducteurs spécialisés ?
Traduire le livre de référence sur le deep learning, à l'aide du deep learning, voici une mise en abymes qui ne manque pas de sel... Cette prouesse vient d'être réalisée par Quantmetry, start-up française(1), en partenariat avec DeepL GmbH(2), entreprise basée en Allemagne.
Paru en 2016, sous le titre "Deep Learning" et écrit par trois experts mondiaux du domaine, Ian Goodfellow, Yoshua Bengio et Aaron Courville, cet ouvrage de référence est une des bibles des ouvrages concernant l'Intelligence artificielle.

Le deep learning (ou apprentissage profond) est un type d'intelligence artificielle dérivé du machine learning (apprentissage automatique) où la machine est capable d'apprendre par elle-même par l'expérience et de comprendre le monde en termes de hiérarchie de concepts, contrairement à la programmation où elle se contente d'exécuter à la lettre des règles prédéterminées. Dans l'apprentissage profond, il n'est pas nécessaire qu'un opérateur humain spécifie formellement toutes les connaissances dont l'ordinateur a besoin.

Depuis sa parution en anglais, l'ouvrage faisait l'objet de nombreuses demandes, notamment d'une traduction pour la France, pays épris de tradition mathématique, et de nombreux pays et nations francophones accueillant des laboratoires de pointe en intelligence artificielle

Si au départ les éditeurs ont pensé faire réaliser la traduction de façon "classique", c'est-à-dire en recourant à des traducteurs humains, ils ont très vite réalisé l'ampleur et le coût du projet que représentait une telle aventure...  Pour ce livre très technique, nécessitant des traducteurs spécialisés, le prix était estimé à quelque 150000 euros pour les 800 pages que comprend  l'ouvrage original, et un temps de traduction pouvant se monter à plus d'une année avec dix traducteurs... Pas évident, lorsqu'on sait que même si ce livre est une bible, il s'adresse principalement à un public très spécialisé (étudiants, professeurs, ingénieurs, chercheurs...).

C'est pourquoi, Quantmetry et DeepL ont développé, durant le printemps dernier, un outil permettant sa traduction de l'anglais vers le français. Un véritable défi, car il ne s'agissait pas ici de passer par des traducteurs automatiques standards, qui n'auraient conduit qu'à de l'à peu près, et aurait nécessité finalement par la suite un temps énorme de relecture et de corrections de la part des traducteurs humains.
L'outil développé a donc su tenir compte du contexte de chaque phrase, des mots pouvant avoir plusieurs significations, des sous-entendus, des subtilités et des tournures spécifiques de phrases de la langue française.
A propos de l'outil :
Quantmetry et ses spécialistes ont consacré trois mois à développer un outil qui permette à DeepL de s'attaquer à ce texte très technique et pointu. L'essentiel ici consiste en un lexique des termes mathématiques de la discipline, intégrant nuances et contextes. S'y ajoutent la capacité de traiter les textes en LaTeX (le Microsoft Word des scientifiques) ainsi que les figures. L'IA n'a mis ensuite que douze heures pour traduire l'ensemble.

Coût total de l'ouvrage :
Pour l'ensemble de cette publication, comprenant le coût de développement de l'outil et le cofinancement de l'édition, le coût se monterait environ à 30 000 euros(3), soit un peu plus de trois fois moins cher que pour une édition par méthode "standard".
Même si une équipe de quatre chercheurs de différents organismes(4) [ainsi que Nicolas Bousquet, directeur scientifique de Quantmetry] a ensuite supervisé la relecture finale, la traduction donnée par l'IA relevait d'un niveau encore jamais atteint à ce jour. Ceci a permis de réduire drastiquement les coûts qu'auraient nécessité une traduction "humaine", mais aussi de gagner 80% de temps, sachant que la traduction par l'IA n'a pris alors que douze heures et l'opération de relecture par les experts seulement deux mois et demi.
"85% du texte est resté tel que traduit par l'iA. Les corrections ont donc été marginales", a expliqué Jérémy Harroch, fondateur et PDG de Quantmetry.
Dès lors, l'ouvrage, coédité par Florent Massot et Quantmetry. sera disponible à partir du 18 octobre.

Une perte sèche pour les traducteurs spécialisés ?

Pour Alexandre Stora, en charge de l'accélérateur de start-up de Quantmetry et qui s'est adressé à la presse : "Sans l'IA, l'équation économique aurait été très difficile pour ce type de livre qui se vend au mieux à quelques milliers d'exemplaires." (...)  "Il aurait fallu en outre  que des scientifiques consacrent au moins une année au travail de traduction. Ils n'ont pas le temps !"

Ainsi, ceci suggère que sans cela, le livre français n'aurait pu exister. Alors oui, dans ce cas précis, on peut penser que l'IA est une très bonne chose, n'étant pas venue enlever le pain de la bouche des traducteurs spécialisés.

Mais faisons tout de même le calcul : si finalement ce livre est une bible demandée par la communauté scientifique francophone (et sachant que les ouvrages de référence durent dans le temps), n'aurait-il tout de même pas pu être traduit par des méthodes "standards" et que tout le monde y gagne ?
Mais voilà, il me suffirait d'écrire dans cet article une belle phrase, du type  "sans l'IA, ce livre n'aurait jamais pu être proposé, et cette traduction répond à l'ambition de faciliter la transmission des connaissances les plus avancées sur le sujet... ", pour que tout le monde dise "Bravo !".
Mais on peut aussi vouloir aller plus loin que les apparences et s'interroger sur le nombre de personnes francophones pouvant être intéressées par l'acquisition de cet ouvrage. Est-ce ridicule de chiffrer celui-ci à 3000 personnes pour toute la communauté francophone ?... sachant d'ailleurs aussi que des instituts et bibliothèques universitaires sont aussi susceptibles de le commander et qu'il s'agit là, répétons-le, d'une bible(5) concernant un domaine qui ne va cesser de s'imposer dans notre société ? Ajoutons aussi, tous les éditeurs le savent, qu'un ouvrage de référence se vend sur plusieurs années... Et donc sur la durée, on n'est pas perdant...
Alors, si on table aussi sur le fait que les ventes d'un livre de référence s'installent dans le temps, un chiffre de 3000 personnes semble raisonnable vu l'importance du sujet (à moins que tout le monde lise parfaitement l'anglais et préfère lire la langue de Shakespeare dans le texte...). Dans ce cas, diviser 150 000 euros par 3 000 donne un coût de l'ouvrage brut de 50 euros. En rajoutant de la TVA, et une marge bénéficiaire, disons que l'ouvrage pourrait se vendre à 75 euros et tout le monde y retrouverait ses petits....
Or le livre est annoncé à la vente à 69 euros... pour un coût total de réalisation bien moindre.

Peut-être que oui, ce livre n'aurait jamais été traduit si il y avait vraiment risque d'une trop petit niche de vente.
Et peut-être que non... le livre aurait trouvé son marché en recourant à des traducteurs spécialisés.
En tous cas, on aimerait bien connaître l'étude de marché préalable nous expliquant que cet ouvrage n'aurait jamais pu trouver suffisamment d'acquéreurs si on l'avait réalisé par les méthodes "traditionnelles". Même si les chercheurs lisent facilement les livres en anglais, il n'en est pas forcément de même pour tous les étudiants...

Finalement, ne va-t-on pas assister à un engouement de tous les éditeurs scientifiques pour le recours à la traduction par l'IA pour toute traduction des ouvrages de physique, chimie, mathématiques, voire ouvrage d'économie...). Bien sûr, cette traduction serait supervisée ensuite (pour certains de ces ouvrages) par quelques spécialistes, mais ceci entraînerait tout de même alors une perte sèche de temps de travail et donc de rémunération pour les traducteurs spécialisés(6)... A moins que ne soit publié un nombre de titres de livre plus important
Bien sûr, on pourra aussi toujours argumenter en disant que ce système rend un service majeur, puisqu'il minimise le temps d'arrivée en France d'ouvrages traduits susceptibles d'intéresser la communauté scientifique.
En tous cas, ce sont désormais des questions à poser.

Une bonne chose semble à signaler : selon certains articles parus dans la presse, Quantmetry prévoirait de mettre bientôt son outil à disposition de tous pour faciliter la traduction d'articles de recherches ou de thèses, traductions qui n'existent pas aujourd'hui(7).

 

A propos de l'ouvrage

"L'Apprentissage profond", seul livre complet sur ce sujet, présente un contexte mathématique et conceptuel pour l'apprentissage profond, couvrant les fondations de l'algèbre linéaire, de la théorie des probabilités et de l'information, du calcul numérique et de l'apprentissage automatique.
Il présente un large éventail d'applications concernées par cette technique : traitement du langage naturel,  reconnaissance vocale, vision par ordinateur,  systèmes de recommandation en ligne, bioinformatique, jeux vidéo...

L'ouvrage s'adresse notamment aux étudiants en cycles supérieurs d'industrie ou de recherche, et aux ingénieurs logiciel souhaitant intégrer l'apprentissage profond dans leur produit ou plateformes.


4ème de couverture de "L'apprentissage profond"

Table des matières :
    Remerciements
    Notation
    1 Introduction
    Partie I : Mathématiques appliquées et notions de base de l'apprentissage machine
        2 Algèbre linéaire
        3 Probabilité et théorie de l'information
        4 Calcul numérique
        5 Notions de base sur l'apprentissage machine
    Partie II : Réseaux profonds pratiques modernes
        6 Rétroaction des réseaux profonds
        7 Régularisation pour l'apprentissage profond
        8 Optimisation de l'entraînement des modèles profonds
        9 Réseaux convolutifs
        10 Modélisation des séquences : Réseaux récurrents et récursifs
        11 Méthodologie pratique
        12 Applications
    Partie III :La recherche en apprentissage profond
        13 Modèles à facteurs linéaires
        14 Auto-encodeurs
        15 Apprentissage de représentation
        16 Modèles probabilistes structurés pour l'apprentissage profond
        17 Méthodes de Monte Carlo
        18 Fonction de partition
        19 Inférence approximative
        20 Modèles génératifs profonds
       Bibliographie
       Index
 
Christophe Jacquemin
puce note Notes
(1) Forte de ses experts en statistiques et en technologies Big Data, cette start-up poursuit trois axes principaux de développement : Stratégie Data, IA (machine learning, deep learning, traitement du langage, computer vision, interprétablité des modèles) et Data Science et architectures et technologies.
(2) Fondée en 2009 et basée à Cologne, DeepL GmbH est une entreprise leader dans le domaine de l'apprentissage profond qui utilise l'intelligence artificielle (IA) et l'apprentissage machine (ML) pour plusieurs produits de traduction, tels que le dictionnaire bilingue "Linguee" ou le service de traduction automatique "DeepL", considéré actuellement comme un des meilleurs au monde, dépassant en qualité de traduction les géants du secteur tels que Google ou Microsoft...*
(3) Selon certains informations parues dans la presse.
(4) Ce livre fait partie des best-sellers de l'édition scientifique : 10000 ventes ont été enregistrées par exemple sur Amazon fin 2016, après sa parution en anglais.
(4) Fabien Navarro (ENSAI) ; Salima El Kolei (ENSAI) ; Benjamin Guedj (Inria) ; Christophe Chesneau (Université Caen - CNRS) ; Nicolas Bousquet (Quantmetry & Sorbonne Université)
- ENSAI : Ecole nationale de la statistique et de l'analyse de l'information
- INRIA : Institut national de recherche en informatique et en automatique ("Inventeurs du monde numérique)
- CNRS : Centre national de la recherche scientifique.
(5) Il faut savoir que le métier principal des traducteurs spécialisés n'est pas forcément celui d'être d'abord chercheur... Citons par exemple cet ouvrage de Gilbert Chauvet "La vie dans la matière", ouvrage de référence d'abord paru en français chez Flammarion (eh oui, des ouvrages scientifiques français de référence et de réputation mondiale existent) qui a donné ensuite lieu à une version anglaise chez Wolrd Scientific sous le titre de "The mathematical nature of the living world - the power of integration". Un livre pointu, truffé de termes propres à la biologie intégrative et de mathématiques. Son traducteur n'est pourtant pas chercheur, mais simplement traducteur spécialisé. On pourrait rétorquer : d'accord, mais ici, le livre ne fait que 292 pages... Sauf que cela a été exactement la même chose pour son "Traité de physiologie théorique" (une somme) en trois volume... D'abord un traducteur spécialisé, puis, seule différence avec l'ouvrage précédent, relecture des formules mathématiques par des spécialistes. Une somme de quelque 1250 pages...
(6) F
aire une telle annonce, c'est aussi  admettre alors en toile de fond que tous les lecteurs ne comprennent pas forcément les publications en anglais, ce qui est rare dans le domaine scientifique, ou tout du moins, préfèrent lire celles-ci en français, en tous cas les étudiants.
  • twitter
  • facebook
  • linkedin
  • messagerie
  • impression

A Lire aussi

Médecine - Transhumanisme - Intelligence artificielle - Société
Informations légales | Données personnelles