On doit le projet CETI à Shafi Goldwass, une informaticienne et experte en cryptographie. Un jour, alors qu’elle écoute un enregistrement audio sur lequel on entend le cliquetis émis par les baleines (également appelé codas), elle fait le rapprochement avec des bruits de circuit défectueux ou du code Morse. Elle lance alors le projet dans le but de comprendre ce que disent ces mammifères marins.
Pour communiquer avec d’autres cachalots ou d’autres espèces de baleines, cet immense mammifère produit des craquements, des coups ou des clics saccadés qui peuvent être entendus par d’autres espèces se trouvant parfois à quelques centaines de kilomètres. Leurs messages peuvent être brefs et ne durer que quelques secondes, ou parfois, passer la barre de la demi-heure. Ces chants sont connus par les scientifiques sous le nom de “codas” et ils se demandent si ces motifs sont assez complexes pour qu’on puisse les considérer comme une langue à part entière.
Les chercheurs comptent déchiffrer ces sons grâce à la technologie de Traitement Naturel du Langage (NLP), une sous-catégorie d’intelligence artificielle focalisée sur le traitement du langage oral et écrit. Un algorithme NLP a déjà réussi à déchiffrer des codas, avec un résultat prometteur. Le système fonctionne déjà très bien, « du moins pour les tâches relativement simples » affirme le directeur du projet Michael Bronstein. Pour pouvoir étudier le langage des baleines, les scientifiques doivent toutefois collecter une importante quantité de données.
À l’heure actuelle, le projet CETI dispose d’une base de données d’enregistrements correspondant à environ 100 000 clics de cachalots. Ils ont été recueillis par des biologistes marins pendant plusieurs années. Malgré cet ensemble de données relativement conséquent, les modèles de machine learning élaborés par les chercheurs pourraient avoir besoin d’environ 4 millions de clics pour comprendre réellement les chants, ainsi que ses redondances et ses particularités.
Toutefois, pour combler ce manque, le projet CETI a mis en place de nombreux canaux automatisés pour collecter des enregistrements de chants de cachalots. Des microphones sous-marins placés dans les zones de l’océan où ces mammifères se regroupent généralement et largués à l’aide de drones repérant un groupe de cachalots pourront accomplir cette tâche. De plus, des robots aquatiques pourront suivre et écouter ces espèces marines discrètement d’une certaine distance.
Des difficultés pour mener à bien le projet CETI :
Même si les chercheurs du projet sont confiants, ils ne cachent pas le fait qu’il existe des difficultés qui pourraient leur mettre des bâtons dans les roues :
- il peut être difficile de savoir quand un mot débute et quand il se termine. En effet, comme lorsque nous écoutons une personne s’exprimer dans une langue étrangère que nous ne comprenons pas, il est très compliqué de distinguer chaque mot dans une phrase. Les algorithmes de machine learning trouvent l’audio plus difficile à analyser que le texte ;
- même si nous parlons différentes langues à travers le monde, nous parlons souvent des mêmes actualités, nous avons tous les mêmes sujets de discussion qui peuvent revenir. Donc, même si nous avons du mal à comprendre une langue, on peut néanmoins être sur que les dires évoqués par une personne dont on ne comprend pas la langue ne soient pas loin des dires que l’on peut exprimer au quotidien avec des amis ou notre famille. Pour les cachalots, c’est différent puisqu’ils vivent dans les océans, un monde que nous côtoyons que très peu ;
- selon une étude de 2016, Shane Gero, Hal Whitehead et Luke Rendell ont analysé les chants de neuf groupes de cachalots différents. Leur conclusion : les cachalots auraient des dialectes différents. Une difficulté supplémentaire à prendre en compte.
Les experts estiment être capables de communiquer avec les cachalots d'ici cinq ans. Ils n'en sont pour le moment qu'au début du projet, avec la mise au point de prototypes non invasifs à fixer sur ces grands mammifères, afin d'enregistrer leurs clics. Et malgré ces difficultés, les chercheurs ne baissent pas les bras et prennent plaisir à réaliser cette étude tout en espérant que si cela fonctionne, leurs méthodes pourront être appliquées à d’autres animaux.
Source : Projet CETI
Et vous ?
Que pensez-vous d’un tel projet ?
Pensez-vous que cette IA aura un jour assez de bon sens pour comprendre le langage des baleines ?
Voir aussi :
L'IA n'a toujours pas le bon sens pour comprendre le langage humain, les chercheurs devraient aller au-delà du deep learning dans le traitement du langage naturel, selon une étude
De nombreuses « IA » sont des personnes qui restent derrière l'écran, 40 % des prétendues startups d'IA en Europe ne présentaient aucune preuve d'utilisation réelle de l'IA en 2019
Une machine Neuralink reliant le cerveau humain à des ordinateurs et donc l'IA va bientôt voir le jour, déclare Elon Musk
L'IA aurait résolu en moins d'une seconde « le problème à trois corps », vieux de trois siècles, grâce à un réseau neuronal, d'après des chercheurs