Le traducteur IA groenlandais inspire les petites langues du monde entier | Polarjournal
.
Les pages d’accueil de Sermitsiaq sont toujours bilingues. Depuis 1958, tous les articles sont publiés à la fois en danois et en kalaallisut (groenlandais), ce qui permet au journal de disposer d’un vaste catalogue qui a servi de données pour entraîner une IA. Photo : Sermitsiaq sur Facebook

La télévision nationale française fait partie des utilisateurs potentiels d’un outil d’intelligence artificielle développé pour le journal groenlandais Sermitsiaq.

L’année dernière, la start-up danoise Media Catch a contacté le plus grand journal du Groenland, Sermitsiaq, avec une proposition commerciale. Elle voulait faire ce que personne n’avait pu faire auparavant : créer un outil d’IA qui traduirait automatiquement les articles du journal du danois vers le groenlandais.

Masaana Egede, PDG et rédacteur en chef de Sermitsiaq, était sceptique.

« Comme de nombreux Groenlandais, j’étais convaincu que le groenlandais était l’une des langues les plus difficiles au monde et qu’un ordinateur ne pourrait jamais l’apprendre. Au fil des ans, de nombreux experts l’ont affirmé. Mais malgré cela, ils nous ont persuadés d’essayer », a déclaré Masaana Egede au Polar Journal.

Aujourd’hui, Masaana Egede est heureux de cette décision. Car non seulement Media Catch a pu créer un traducteur IA fonctionnel, mais son outil a si bien fonctionné qu’il inspire aujourd’hui d’autres petites langues dans le monde.

À tel point que, selon Masaana Egede, si Sermitsiaq avait été une entreprise à but lucratif, elle aurait rapidement pu gagner « beaucoup d’argent ».

.
Masaana Egede est le PDG et le rédacteur en chef de Sermitsiaq depuis juin 2023. Il ne lui a pas fallu longtemps pour accepter le développement d’une IA basée sur le catalogue de Sermitsiaq. Photo : Aros Business Academy

Tous les traducteurs sont encore employés

Le Groenland est une société bilingue. Selon la loi, tous les textes gouvernementaux doivent être publiés à la fois en danois et en kalaallisut (groenlandais). Par conséquent, ce petit pays arctique dépense chaque année des fortunes en traductions, et un outil de traduction entièrement automatique serait donc un atout lucratif.

Pour Sermitsiaq aussi, tout est bilingue. Depuis 1958, le journal publie tous ses articles dans les deux langues. Aujourd’hui, un article est généralement rédigé en danois avant d’être traduit et publié en groenlandais quelques heures plus tard.

Pour effectuer ces traductions, Sermitsiaq emploie quatre traducteurs à temps plein. Ces traducteurs, tous encore employés, ont été libérés pour effectuer d’autres tâches au sein du journal.

« Il est faux de croire que les traducteurs perdront leur emploi. Je ne le crois pas. Je pense que cet outil leur sera utile, ainsi qu’aux autres citoyens du Groenland qui parlent deux langues », a déclaré Masaana Egede.

« Le flux de travail de nos traducteurs va changer. Au lieu de traduire mot à mot, ils recevront désormais une traduction approximative qu’ils vérifieront pour détecter les erreurs. Cela leur permettra de gagner du temps », a-t-il déclaré.

Il souligne que la structure de propriété de Sermitsiaq est celle d’un fonds à but non lucratif. Pour cette raison, le nouvel outil appelé Nutserisoq n’est pas disponible à l’achat. En revanche, il n’est accessible qu’aux abonnés de Sermitsiaq, ce qui garantit que les bénéfices tirés de ce nouvel outil soutiendront l’objectif de Sermitsiaq de garantir un journalisme de qualité au Groenland.

Cet ajout de traduction a permis à Sermitsiaq de plus que doubler le nombre de ses abonnés numériques depuis son introduction.

.
Dans le cadre d’une enquête en aveugle, Sermitsiaq a testé la qualité de son nouvel outil par rapport à GPT-4, le logiciel qui sous-tend la dernière version de ChatGPT, et à Nutserut, un outil de traduction groenlandais sans IA. Le test comprenait 50 phrases aléatoires et a été évalué par des traducteurs professionnels. Comme le montre le graphique, Nutserisoq a obtenu de bien meilleurs résultats que ses concurrents. Photo : Nutserisoq.gl

Catalogue d’articles de haute qualité

Mais comment se fait-il qu’une petite start-up danoise ait pu réussir là où de grandes entreprises technologiques comme Google et Open AI avaient échoué ?

Tout d’abord, selon Masaana Egede, le Groenland ne comptant que 57 000 habitants, le marché est trop petit pour que les grandes entreprises technologiques y investissent. Les gains potentiels ne sont tout simplement pas au rendez-vous.

Mais deuxièmement, et plus intéressant encore, Media Catch a été en mesure de travailler avec des données de bien meilleure qualité. Au lieu de parcourir l’internet à la recherche de données de qualité variable, le nouveau modèle d’IA a utilisé l’ensemble du catalogue de 23 000 articles de Sermitsiaq couvrant une période de 20 ans.

Tous ces articles existaient à la fois en danois et en groenlandais, et comme il existait un grand nombre de traductions de haute qualité, Media Catch a pu créer un outil fonctionnel avec beaucoup moins de données que les grands modèles linguistiques tels que ChatGPT.

« Le premier modèle que j’ai vu était assez mauvais, et je pensais qu’il échouerait comme il l’avait déjà fait auparavant », a déclaré Masaana Egede.

Mais avec le deuxième, je me suis dit : « D’accord, cela pourrait peut-être m’aider un peu ». Et quand j’ai vu le troisième, je me suis étouffé avec mon café et je me suis dit : ‘wow, c’est fou que ce soit possible' », se souvient-il.

Une courte vidéo pour présenter la simplicité de l’outil de traduction.

La télévision française inspirée

Masaana Egede n’est pas le seul à être impressionné par le nouvel outil de traduction. Le fait que des données limitées mais de grande qualité provenant d’un organe d’information puissent être utilisées pour créer un outil de traduction signifie qu’il pourrait être utile à d’autres petites langues dans le monde.

« Notre succès implique que cela pourrait fonctionner ailleurs. Il existe de nombreuses langues dans le monde qui, comme le groenlandais, ne sont pas considérées comme prioritaires par les grandes entreprises technologiques. Elles ont simplement besoin d’un ensemble de données comme le nôtre », a-t-il déclaré.

Selon Masaana Egede, de nombreuses personnes ont manifesté leur intérêt pour ce nouvel outil. Début avril, par exemple, Masaana Egede a présenté ses résultats au Nordic AI in Media Summit à Copenhague.

Sa présentation a été ovationnée et, par la suite, un représentant de la télévision nationale française l’a contacté. Il voulait savoir si le même outil pouvait être utilisé pour traduire certaines langues régionales et d’outre-mer, comme le breton, l’alsacien et le tahitien. Masaana Egede l’a mis en contact avec Media Catch, afin qu’ils puissent évaluer si une solution similaire serait possible en France.

« Les personnes qui m’appellent ou m’écrivent au sujet de cet outil ont manifesté beaucoup d’intérêt. Je pense que l’une des raisons pour lesquelles tant de personnes sont intéressées est qu’il s’agit d’un outil relativement simple », a déclaré Masaana Egede.

« Certains outils d’IA sont si compliqués que seules quelques personnes du service informatique savent les utiliser, mais cet outil s’est avéré utile non seulement dans notre entreprise, mais aussi dans d’autres entreprises du Groenland », a-t-il déclaré.

Ole Ellekrog, Polar Journal AG

Plus d’informations sur le sujet :

Print Friendly, PDF & Email
error: Content is protected !!
Share This