Traducteur en ligne «Hadretna» : Premier modèle d’IA générative en dialectes d’Algérie

Une conférence de presse a été organisée pour le lancement officiel de « Hadretna », un algorithme de traduction en ligne des différents dialectes parlés en Algérie, développé par la start-up Fentech, opérant sous le nom Tamatech, en partenariat avec l’éminent scientifique et chercheur le Pr Merouane Debbah. Le professeur directeur scientifique de « Hadretna » a entamé son intervention […] The post Traducteur en ligne «Hadretna» : Premier modèle d’IA générative en dialectes d’Algérie appeared first on Le Jeune Indépendant.

Juin 26, 2024 - 20:40
 0
Traducteur en ligne «Hadretna» : Premier modèle d’IA générative en dialectes d’Algérie

Une conférence de presse a été organisée pour le lancement officiel de « Hadretna », un algorithme de traduction en ligne des différents dialectes parlés en Algérie, développé par la start-up Fentech, opérant sous le nom Tamatech, en partenariat avec l’éminent scientifique et chercheur le Pr Merouane Debbah.

Le professeur directeur scientifique de « Hadretna » a entamé son intervention en déclarant se réjouir de pouvoir présenter « le premier modèle d’intelligence artificielle générative en dialectes d’Algérie, pour valoriser notre façon de parler d’est en ouest et du sud, en passant par le nord du pays».

L’objectif de la base de données «Hadretna», qui signifie « notre parler » en daridja, ambitionne à contribuer à la préservation de la diversité linguistique et culturel dans le pays, tout en favorisant le développement de services accessibles aux 45 millions d’Algériens, a ajouté le Pr Debbah, lors de cette conférence organisée sous l’égide du ministère de l’Economie de la connaissance, des Start-up et des Microentreprises, mardi, à l’Hôtel Marriott (Alger).

Le directeur scientifique a également fait savoir que cet algorithme de traduction en ligne représente « le fruit de six mois de travail avec les ingénieurs de la start-up Fentech, avec laquelle je suis associé ». Il a précisé que cette œuvre « est, à ce stade, alimentée par deux Giga Token de données collectées en ligne dans trois alphabets, « arabe, latin, tifinagh », soulignant que cet algorithme, présenté aujourd’hui, est la première étape indispensable vers la mise en œuvre d’un modèle d’intelligence artificielle générative.

Concernant l’objectif de cette intelligence artificielle, le chercheur scientifique a indiqué qu’elle entre dans une optique de créer un pont linguistique entre les différents dialectes parlés en Algérie, permettant ainsi à tous ses habitants d’accéder à n’importe quelle information dans leur dialecte maternel. « Souhaitons que celle-ci – cette intelligence artificielle – contribuera à l’inclusion numérique de tous les Algériens », a-t-il dit. Pour être performant, un « Large Language Model (LLM) algérien utilisant les dialectes répandus en Algérie nécessite d’être entraîné sur une importante quantité de ressources textuelles », selon le professeur, qui précise que l’anglais représente aujourd’hui 45 % du contenu disponible sur internet. Les LLM les plus connus (Chat GPT d’Open AI, Lama de Meta, Gemini de Google) ont donc été conçus, en grande partie, dans cette langue, « cela ne fonctionne donc pas dans le langage qui est le nôtre ».

En effet, construire un LLM sur des dialectes disposant d’une documentation écrite limitée représente un défi technique majeur. LLM, qui est l’équivalent de Chat GPT, est un modèle de langage possédant un grand nombre de paramètres. Ce programme informatique a reçu suffisamment de bases de données, notamment écrites, pour être capable de générer du contenu original des textes, des images et des vidéos.

Afin de réaliser cet objectif, les équipes de Hadretna travaillent à la construction du plus grand corpus de textes dans les différents dialectes en circulation en Algérie. « Notre ambition est de construire le premier LLM en dialectes d’Algérie », a fait savoir Moussab Djerrab, directeur scientifique de Fentech. « Pour atteindre cet objectif, nous avons lancé le site internet www.hadretna.ai. Toutes les personnes qui le souhaitent peuvent ainsi participer au projet en alimentant Hadretna avec leurs traductions et leurs annotations ».

Une fois constituée, cette nouvelle base de données permettra d’entraîner la version 2 de Hadretna. Les modèles d’IA élaborés sur ces données seront mis en open-source sur une plate-forme à venir. Fondée par trois frères en 2018, Fentech est une start-up qui développe une plate-forme d’intelligence artificielle permettant aux entreprises, tous secteurs confondus, d’optimiser leurs décisions en temps réel : optimiser la consommation d’énergie, prédire la consommation d’un produit, fixer les prix, gérer les stocks). Elle dispose de bureaux à Alger et à Paris.

 

The post Traducteur en ligne «Hadretna» : Premier modèle d’IA générative en dialectes d’Algérie appeared first on Le Jeune Indépendant.

Quelle est votre réaction ?

like

dislike

love

funny

angry

sad

wow