Au cas où certains d’entre vous ne connaîtraient pas l’histoire de la traduction automatique (TA) , celle-ci est presque aussi vieille que les ordinateurs eux-mêmes. En 1954, l’université de Georgetown et IBM ont réussi à traduire plus de 60 phrases russes en anglais. Cette expérience, connue sous le nom de Georgetown Experiment, est l’un des premiers projets de TA enregistrés. Bien que les chercheurs de l’époque n’aient pas pu aller plus loin, en raison de l’énorme puissance de traitement et de stockage des données qu’elle nécessitait, nous constatons que l’idée que des ordinateurs puissent traduire des langues humaines est loin d’être nouvelle.

Mais les progrès récents en matière d’intelligence artifcielle, et de hardware permettentont permis d’améliorer de façon significative la traduction des langues. Le marché de la traduction automatique devrait dépasser les 7,5 milliards de dollars amé d’ici 2030, comme l’indique une étude de Global Market Insights.

Qu’est-ce que la traduction automatique ?

Pour ceux qui ne connaissent pas du tout ce domaine, la traduction automatique peut être définie comme « le processus de traduction automatique de contenu d’une langue à une autre sans intervention humaine ». Mais la TA moderne va au-delà de la simple traduction d’un texte mot à mot. Elle peut restituer le sens complet de la langue source en analysant tous les éléments et leurs relations dans le texte source.

Les types de traduction automatique

Il existe aujourd’hui quatre grands types d’outils de traduction automatique, tous basés sur le traitement naturel du langage :

La traduction automatique statistique (TAS) : Avec la TMS, d’énormes volumes de contenus bilingues sont étudiés pour créer des modèles statistiques. Une correspondance directe est trouvée entre un mot de la langue source et un mot de la langue cible. Google Translate est probablement la version la plus connue de la TMS. Cependant, elle est incapable de prendre en compte le contexte du texte source, ce qui peut conduire à une traduction de mauvaise qualité.
Traduction automatique basée sur des règles (RBMT) : Cette méthode consiste à examiner la grammaire des langues source et cible, puis à utiliser des règles de base pour effectuer la traduction. Le résultat peut nécessiter une révision approfondie.
Traduction automatique hybride (HMT) : Il s’agit d’un mélange des deux premiers systèmes qui fonctionne avec plus de succès. Au fur et à mesure qu’il fonctionne, il crée et constitue une mémoire de traduction, ce qui permet d’obtenir un travail de meilleure qualité à mesure qu’il est utilisé. Il nécessite néanmoins une quantité considérable de révision humaine.
Traduction automatique neuronale (NMT) : Beaucoup plus complexe et coûteuse à développer et à utiliser, la NMT crée des modèles de réseaux neuronaux basés sur le cerveau humain. À partir de ces modèles, des modèles de traduction statistiques sont construits, ce qui permet de déchiffrer les complexités des deux langues. C’est l’approche que nous avons choisit chez LenseUp.

La traduction automatique: pour quelles utilisations?

La Traduction Automatique  peut aller bien au-delà de la simple traduction et peut être appliquée à de nombreux autres cas d’utilisation. En voici quelques exemples :

Assistance à la clientèle

Si votre entreprise fait des affaires avec des pays qui utilisent une langue qui ne leur est pas familière, la TA peut vous aider. La TA peut non seulement traduire la langue des tickets soumis par vos clients, mais aussi les trier et les catégoriser (ou parfois même y répondre) en comprenant le contexte de chaque ticket soumis.

Traitement de documents juridiques

Votre service juridique peut également utiliser la TA pour traduire des documents juridiques dans différentes langues sans avoir à engager des traducteurs supplémentaires compétents dans ce domaine. Grâce à la TA, une grande quantité de contenu juridique peut rapidement être disponible pour analyse dans plusieurs langues, alors que la traduction et le traitement manuels auraient été très longs.

Médias

La MT peut aider les plates-formes comme Netflix ou Disney+ à localiser efficacement leurs médias et à les fournir aux utilisateurs sous différents formats, qu’il s’agisse de sous-titrage, de sous-titres, de doublage, etc. Elle peut et va être utilisée de plus en plus en temps réel.

Ce ne sont là que quelques-uns des exemples d’utilisation de la TA. Si vous êtes actuellement submergé par des données qui doivent être traduites dans une autre langue, la TA est là pour vous aider.

Le marché de la traduction automatique

Nous vivons une époque où tout le monde peut être producteur de contenu, que ce soit en téléchargeant une vidéo sur Youtube, en écrivant un article sur une plateforme ou en publiant quelque chose d’intéressant sur un blog (comme ce que je fais en ce moment), ou avec un podcast. En raison de cette augmentation du volume, le marché de la traduction automatique connaît également son âge d’or, avec de nombreuses entreprises de premier plan qui se lancent dans ce domaine.

Google Translate

Il s’agit probablement de l’outil de TA le plus utilisé, tout le monde l’a utilisé. Google Translate est l’un des ancêtres des plates-formes de TA, et il reste fort à ce jour. Cependant, malgré sa position de leader des plates-formes de TA, sa précision laisse parfois à désirer, surtout lorsqu’il s’agit de certaines langues asiatiques comme le coréen, le chinois, etc.

Les glossaires servent à spécifier les paires de mots qui doivent être traduits d’une manière donnée, en particulier lorsqu’il s’agit de mots ambigus ou empruntés ou de noms de produits.

Ils constituent également un bon outil pour améliorer les traductions, en particulier lorsque nous travaillons avec des langues moins répandues. Par exemple, le mot catalan « home », qui signifie homme, est compris par Google comme le mot anglais « home » et, par conséquent, traduit en français par « domicilie » :

Dans certains cas, l’utilisation de glossaires devient inévitable et Google Translate dispose de cette fonctionalité.

Amazon translate

Amazon Translate est un service en nuage permettant de convertir de grandes quantités de texte écrites dans une langue vers une autre langue. Amazon Translate prend en charge 25 langues, la documentation officielle détaillant les langues qui peuvent être associées pour la traduction. Les utilisateurs peuvent également personnaliser la terminologie propre à leur organisation, comme les noms de marques et de produits.

Amazon Translate utilise l’apprentissage automatique et un modèle d’apprentissage continu pour améliorer l’efficacité de la traduction au fil du temps. Il existe de nombreux types de cas d’utilisation du service, notamment la traduction de contenu d’assistance en ligne, de matériel de formation développé en interne, de documentation, d’informations ou d’instructions d’application et de divers autres scénarios dans lesquels le texte doit être disponible en plusieurs langues.

Amazon Translate prend en charge 25 langues, la documentation officielle détaillant les langues qui peuvent être associées pour la traduction. Les utilisateurs peuvent également personnaliser la terminologie propre à leur entreprise, comme les noms de marques et de produits.

DeepL

DeepL Translator est un service de NMT développé par Linguee GmbH (désormais connu sous le nom de DeepL GmbH), une entreprise allemande qui se concentre sur le développement de technologies de traduction automatique par apprentissage profond. Lancé en 2017, DeepL Translator étudie et apprend de manière approfondie les meilleures options de traduction à partir de sources linguistiques fiables.  DeepL est moins  connu par rapport aux deux précédents. Mais son moteur de TA est censé produire des traductions plus naturelles grâce à son IA neuronale. DeepL a commencé par offrir des traductions entre l’anglais, l’allemand, le français, l’espagnol, l’italien, le polonais et le néerlandais, et a ajouté la prise en charge du chinois (simplifié) et du japonais. Grâce à son utilisation de l’intelligence artificielle, DeepL Translator peut fournir des traductions plus précises et plus nuancées par rapport à ses pairs. Il est vraiment à la hauteur de sa propre affirmation d’être « le traducteur le plus précis du monde ».

Bing Microsoft Translator

Bing Microsoft Translator est basé sur le système de traduction automatique exclusif de Microsoft qui s’appuie sur la toute dernière technologie NMT. Comme la plupart des développeurs de logiciels de traduction automatique, Microsoft a concentré ses efforts de recherche sur la production de traductions automatiques plus intelligentes et adaptées à l’utilisation du langage naturel.

Meta AI NLLB (No Language Left Behind)

Les informations ne sont généralement pas disponibles dans les langues des minorités. Cela est dû au fait que la technologie n’est pas disponible pour ces langues. Soit parce que la technologie  ne prend pas en charge la langue humaine minoritaire, soit parce que commercialement ce n’est pas viable.

Selon Meta AI, No Language Left Behind (NLLB) est un projet unique et révolutionnaire en matière d’IA… Le projet a mis en libre accès des modèles capables de fournir des traductions de haute qualité dans 200 langues. Il a été lancé en juillet 2022.

Ces traductions peuvent être effectuées directement entre n’importe laquelle de ces 200 langues, y compris des langues comme l’afrikaans, le zoulou, le sotho, le shona, etc.

NLLB donne  doncaux utilisateurs la possibilité d’accéder au contenu du Web dans leur langue maternelle. Il permet aux gens d’accéder aux informations dans leur propre langue et de communiquer avec n’importe qui, n’importe où.

OpenAI

OpenAI a publié en septiembre 2022 un nouveau modèle d’IA open source appelé Whisper qui reconnaît et traduit des données audio à un niveau proche de la capacité de reconnaissance humaine. Il peut transcrire des entretiens, des podcasts, des conversations, etc.

OpenAI a entraîné Whisper sur 680 000 heures de données audio et de transcriptions correspondantes en 98 langues, collectées sur le Web. Selon OpenAI, cette approche de collecte ouverte a conduit à « une meilleure robustesse aux accents, au bruit de fond et au langage technique. » Il peut également détecter la langue parlée et la traduire en anglais.

OpenAI décrit Whisper comme un transformateur encodeur-décodeur, un type de réseau neuronal qui peut utiliser le contexte glané dans les données d’entrée pour apprendre des associations qui peuvent ensuite être traduites dans la sortie du modèle.

 

Il est évident qu’il y a beaucoup plus d’acteurs sur le marché de la TA, chaque société ou produit ayant ses propres capacités. Cependant, même s’ils sont tous extrêmement utiles pour améliorer la qualité et la productivité de la traduction, on ne peut pas dire qu’ils soient parfaits.

Grâce à l’amélioration constante des technologies de traduction automatique au fil du temps, les logiciels de TA sont devenus une option solide pour les entreprises ayant des besoins de traduction. Cela dit, le service de traduction automatique idéal et universel n’existe pas. La meilleure approche consiste à essayer plusieurs outils de traduction différents et à évaluer s’ils répondent aux besoins spécifiques de votre entreprise.

N’oubliez pas non plus que les logiciels de TA ne sont pas destinés à remplacer complètement la traduction humaine. Après avoir effectué une première série de traductions à l’aide de la TA, vous pouvez demander à un traducteur professionnel de réviser et d’affiner la traduction pour vous assurer qu’elle est adaptée à l’objectif visé. Chez LenseUp, c’est l’approche que nous avons adopté.

LenseUp fournit un service complet couvrant tous les aspects de la localisation, allant de la synchronisation d’un fichier de sous-titres avec un fichier média, à la traduction de ce fichier de sous-titres dans une langue cible, et au doublage de ce fichier média, avec enregistrement de voix-off.