DolphinGemma, un modèle de langage innovant développé par Google, révolutionne la façon dont les scientifiques abordent l’étude de la communication des dauphins. Depuis des décennies, comprendre les clics et les sifflements de ces mammifères intelligents a été un défi dans la science. Vous imaginez-vous pouvoir non seulement écouter les dauphins, mais aussi comprendre leurs conversations ?
À l’occasion de la Journée nationale du dauphin, Google, en collaboration avec des chercheurs du Georgia Tech et du Wild Dolphin Project (WDP), a fait un grand pas dans la recherche de la communication interespèces. DolphinGemma est un modèle d’IA qui s’entraîne à apprendre la structure des vocalisations des dauphins, générant des séquences sonores qui imitent leurs styles de communication.
Étudier la société des dauphins depuis des décennies
Pour comprendre n’importe quelle espèce, un contexte profond est nécessaire, et le WDP fournit cela depuis 1985. Ce projet de recherche sous-marine étudie les dauphins tachetés de l’Atlantique aux Bahamas, créant un vaste ensemble de données comprenant des vidéos et des audios de leur comportement.
L’approche du WDP consiste à observer et analyser la communication naturelle des dauphins. En étant dans leur environnement, les chercheurs peuvent lier des sons spécifiques à des comportements observés, cherchant des motifs qui pourraient indiquer un langage. Cette analyse à long terme est la base de leur recherche et fournit le contexte nécessaire pour toute analyse réalisée par l’IA.
Présentation de DolphinGemma
L’analyse de la communication complexe des dauphins est un défi monumental, et le vaste ensemble de données étiquetées du WDP offre une opportunité unique d’utiliser une IA de pointe. DolphinGemma utilise des technologies audio de Google pour représenter efficacement les sons des dauphins, traitant ces données à travers un modèle conçu pour des séquences complexes. Avec environ 400 millions de paramètres, ce modèle est optimisé pour fonctionner sur les téléphones Pixel utilisés sur le terrain.
Ce modèle est basé sur les connaissances de Gemma, une collection de modèles ouverts de dernière génération de Google. Entraîné de manière extensive avec la base de données acoustique du WDP, DolphinGemma fonctionne comme un modèle d’entrée-sortie audio, traitant des séquences de sons naturels de dauphins pour identifier des motifs et prévoir les sons qui suivront probablement dans une séquence.
Utiliser des téléphones Pixel pour analyser les sons des dauphins
En plus d’analyser la communication naturelle, le WDP explore une interaction bidirectionnelle en utilisant la technologie dans l’océan. Cela a conduit au développement du système CHAT (Cetacean Hearing Augmentation Telemetry), qui vise à établir un vocabulaire partagé plus simple entre les chercheurs et les dauphins.
Le système CHAT associe des sifflements synthétiques à des objets que les dauphins apprécient. Grâce à cette technique, les chercheurs espèrent que les dauphins apprendront à imiter ces sifflements pour demander des objets. À mesure que davantage de sons naturels sont compris, ceux-ci seront également intégrés dans le système.
Partager DolphinGemma avec la communauté de recherche
Reconnaissant la valeur de la collaboration dans la découverte scientifique, il est prévu de partager DolphinGemma comme un modèle ouvert cet été. Bien qu’il ait été entraîné avec des sons de dauphins tachetés de l’Atlantique, son utilité est anticipée pour les chercheurs étudiant d’autres espèces de cétacés. Cette ouverture permettra l’adaptation et l’amélioration du modèle pour différentes vocalisations.
La combinaison de la recherche sur le terrain du WDP, de l’expertise en ingénierie de Georgia Tech et de la puissance de la technologie de Google ouvre de nouvelles et passionnantes possibilités. Nous sommes à la pointe non seulement d’écouter les dauphins, mais de commencer à comprendre les motifs dans leurs sons, nous rapprochant un peu plus de la communication entre humains et dauphins.







