Au cours des cinq dernières années, l'utilisation des grands modèles de langage (LLM) et de la traduction automatique (TA) avancée s'est considérablement accélérée dans le secteur de la traduction et de la localisation.
Malgré cette augmentation, les LLM (Large Language Models) – par définition – posent des défis majeurs au secteur de la traduction. C'est pourquoi nous pensons qu'ils finiront par être délaissés au profit d'un autre modèle d'IA qui correspond mieux aux besoins : le petit modèle de langage (Small Language Model).
Au début, les systèmes de traduction automatique neuronale (TAN), les prédécesseurs des LLM actuels, ont été adoptés avec prudence. En 2019, seulement environ 13 % des projets de traduction destinés aux clients finaux ont utilisé la traduction automatique.
Toutefois, les améliorations rapides de la qualité et de l'efficacité ont favorisé une adoption plus large. En 2020, environ 24 % des projets ont impliqué la TA, soit près du double par rapport à l'année précédente.
L'avènement de véritables grands modèles de langage en 2022 a donné un nouvel élan à l'automatisation des flux de traduction.
De nos jours, l'intégration des LLM dans les flux de travail de traduction est devenue pratiquement la norme dans toutes les organisations à la pointe de la technologie.
Les analystes de Nimdzi observent que « la nouvelle vague d'outils d'IA, tels que les grands modèles de langage (LLM) [et] la traduction automatique améliorée par les LLM, [...] trouve rapidement sa place dans les flux de travail de traduction » en tant que fonctionnalités intégrées aux systèmes de gestion de la traduction, aux plateformes de contenu, aux outils de sous-titrage et bien plus encore.
Pour résumé, ce qui était une technologie expérimentale de niche il y a un peu plus de cinq ans est devenu aujourd'hui un élément essentiel des opérations de traduction et de localisation.
Les généralistes ne surpasseront jamais les spécialistes
Les grands modèles de langage sont extrêmement puissants, flexibles et peuvent exécuter des tâches générales de manière très efficace. Toutefois, leur capacité à exceller dans des tâches générales et la richesse des données d'entraînement qui alimentent cette compétence sont précisément les raisons de leur disparition annoncée en matière de traduction de contenu.
Les LLM à usage général génèrent des textes semblables à ceux produits par des humains sur de nombreux sujets, mais passent souvent à côté des nuances subtiles propres à certains domaines industriels.
Par exemple, lors de la traduction d'un rapport financier, un modèle générique peut mal interpréter le terme « capitaux propres ». En règle générale, le terme « capitaux propres » est le plus souvent utilisé dans un contexte immobilier pour décrire la différence entre la valeur marchande d'un bien immobilier et l'hypothèque en cours d'un bien immobilier. Toutefois, en comptabilité, le terme « capitaux propres » désigne la valeur de la propriété d'une entreprise ou d'actifs.
S'il ne saisit pas ces distinctions, le LLM risque de générer des traductions ou des interprétations erronées, compromettant ainsi la précision des communications essentielles.
Étant donné que ces modèles généraux nécessitent une puissance de calcul importante, leur coût d'exploitation est élevé et leur livraison peut être lente. Leur manque de spécialisation implique également un besoin accru de vérification humaine, ce qui réduit l'efficacité et allonge les délais d'exécution.
Pour les projets de grande envergure, ces facteurs se traduisent par des coûts plus élevés et des résultats plus lents, ce qui a un impact direct sur la qualité et la fiabilité dont dépend votre entreprise.
Comme le dit le proverbe : « Les plus belles choses sont dans de petits écrins ». Notre expérience chez Straker nous a permis de découvrir la véritable puissance des petits modèles de langage.
Contrairement aux modèles LLM généralistes, qui sont des outils à tout faire, nous avons réussi à créer et à entraîner des SLM destinés à des secteurs ou à des tâches spécifiques.
En se concentrant exclusivement sur la localisation, nos modèles ont atteint une précision et une compréhension nuancée inégalées, maîtrisant le jargon industriel, les termes techniques et les complexités linguistiques là où les modèles génériques échouent.
Straker a développé Tiri comme une famille de petits modèles d'IA spécialisés conçus spécifiquement pour la localisation. Plutôt que de fonctionner comme un modèle généraliste, Tiri opère comme une équipe de traducteurs expérimentés, chacun étant formé pour traiter avec précision des langues et des secteurs spécifiques.
Les modèles Tiri sont entraînés sur des données spécifiques de haute qualité, telles que des mémoires de traduction ou des historiques, ce qui leur permet de comprendre la terminologie financière, juridique ou technique avec une précision exceptionnelle.
Par exemple, les performances de nos modèles d'IA spécialisés (comme Tiri J pour le contenu des relations investisseurs du japonais vers l'anglais) démontrent à quel point la personnalisation de l'IA linguistique pour des secteurs spécifiques et les besoins des clients améliore considérablement la qualité de la traduction. Ces modèles fournissent des résultats précis et pertinents pour le secteur, bien au-delà de ce que proposent les solutions commerciales générales.
Étant donné que les modèles Tiri sont plus petits et plus ciblés, ils nécessitent moins de ressources informatiques. Cela permet d'accélérer les vitesses de traitement et de faciliter l'intégration dans les flux de travail existants sans coûts d'infrastructure considérables. Il en résulte une réduction des coûts et des délais d'exécution plus courts, ce qui permet à votre entreprise de se développer efficacement tout en maintenant une production de haute qualité.
Tiri est conçu pour apprendre et évoluer grâce aux rétroactions humaines intégrées directement dans la suite de produits de Straker. Cette approche d'apprentissage par renforcement à partir de la rétroaction humaine (RLHF, Reinforcement Learning from Human Feedback) garantit que les traductions deviennent de plus en plus précises et mieux adaptées aux besoins des clients au fil du temps.
Straker sait que l'avenir des services linguistiques basés sur l'IA réside dans la spécialisation. Les petits modèles de langage personnalisés, tels que Tiri, révolutionnent la manière dont les entreprises localisent leur contenu. Ils offrent une précision, une rapidité et une efficacité supérieures en mettant l'accent sur ce qui compte le plus : la compréhension de la langue dans son contexte.
● Précision accrue – Terminologie prête à l'emploi et contexte spécifique au domaine dès l'installation.
● Réduction des coûts – Les modèles plus petits nécessitent moins de cycles de calcul.
● Délais plus courts – Traduisez, évaluez et publiez en quelques heures, et non plus en plusieurs semaines.
Si les LLM à usage général ont amorcé la révolution dans le secteur de la traduction, nous pensons que les petits modèles de langue la compléteront en fournissant des traductions rapides, évolutives, hyper-ciblées et adaptées au contexte, et cela sans les coûts ni la puissance de calcul des LLM à usage général.
Si votre entreprise a besoin de précision et d'évolutivité en matière de localisation, Tiri est la solution d'IA conçue pour favoriser votre réussite sur un marché de plus en plus mondialisé.
Dirigeants d'entreprise : En savoir plus sur Tiri ici
Ingénieurs : Découvrez nos principes technologiques sur https://labs.straker.ai