Los delfines son conocidos por su inteligencia, comportamientos sociales complejos y sistemas de comunicación intrincados. Durante años, los científicos y los amantes de los animales han sido fascinados por la idea de si los delfines poseen un lenguaje similar al de los humanos. En los últimos años, la inteligencia artificial (IA) ha abierto nuevas posibilidades emocionantes para explorar esta pregunta. Uno de los desarrollos más innovadores en este campo es la colaboración entre Google y el Proyecto Wild Dolphin (WDP) para crear Dolphingemma, un modelo de IA diseñado para analizar las vocalizaciones de los delfines. Este avance no solo podría ayudar a decodificar la comunicación del delfín, sino que también puede allanar el camino para las interacciones bidireccionales con estas criaturas notables.
El papel de AI en la comprensión de los sonidos de los delfines
Los delfines se comunican usando una combinación de clics, silbatos y movimientos del cuerpo. Estos sonidos varían en frecuencia e intensidad, lo que puede indicar diferentes mensajes dependiendo del contexto social, como la búsqueda de alimentación, el apareamiento o la interacción con los demás. A pesar de los años de estudio, comprender la gama completa de estas señales ha demostrado ser un desafío. Los métodos tradicionales de observación y análisis luchan para manejar la cantidad masiva de datos generados por las vocalizaciones de los delfines, lo que dificulta el dibujo de ideas.
La IA ayuda a superar este desafío mediante el uso de algoritmos de procesamiento del lenguaje automático y aprendizaje automático (PNL) para analizar grandes volúmenes de datos de sonido delfín. Estos modelos pueden identificar patrones y conexiones en vocalizaciones que están más allá de las capacidades del oído humano. La IA puede diferenciar entre varios tipos de sonidos de delfines, clasificarlos en función de las características y vincular ciertos sonidos a comportamientos específicos o estados emocionales. Por ejemplo, los investigadores han notado que ciertos silbatos parecen relacionarse con las interacciones sociales, mientras que los clics generalmente están vinculados a la navegación o la ecolocación.
Si bien la IA tiene un gran potencial en la decodificación de sonidos de delfines, la recopilación y el procesamiento de grandes cantidades de datos de las vainas de delfines y los modelos de IA de capacitación en un conjunto de datos tan grande siguen siendo desafíos significativos. Para abordar estos desafíos, Google y el WDP han desarrollado Dolphingemma, un modelo de IA diseñado específicamente para analizar la comunicación de los delfines. El modelo está entrenado en extensos conjuntos de datos y puede detectar patrones complejos en vocalizaciones de delfines.
Comprender el delfingemma
Dolphingemma se basa en Gemma de Google, un modelos de IA generativos de código abierto con alrededor de 400 millones de parámetros. Dolphingemma está diseñado para aprender la estructura de las vocalizaciones de los delfines y generar nuevas secuencias de sonido similares a los delfines. Desarrollado en colaboración con el WDP y Georgia Tech, el modelo utiliza un conjunto de datos de vocalizaciones de delfines manchadas de Atlantic que se han recopilado desde 1985. El modelo utiliza la tecnología SoundStream de Google para tokenizar estos sonidos, lo que le permite predecir el próximo sonido en una secuencia. Al igual que cómo los modelos de lenguaje generan texto, Dolphingemma predice los sonidos que los delfines podrían hacer, lo que lo ayudan a identificar patrones que podrían representar gramática o sintaxis en la comunicación de los delfines.
Este modelo incluso puede generar nuevos sonidos similares a los delfines, similar a cómo el texto predictivo sugiere la siguiente palabra en una oración. Esta capacidad podría ayudar a identificar las reglas que rigen la comunicación de los delfines y proporcionar información sobre la comprensión de si sus vocalizaciones forman un lenguaje estructurado.
Dolphingemma en acción
Lo que hace que Dolphingemma sea particularmente efectivo es su capacidad para ejecutarse en dispositivos como Google Pixel Phones en tiempo real. Con su arquitectura ligera, el modelo puede funcionar sin la necesidad de equipos costosos y especializados. Los investigadores pueden grabar sonidos de delfines directamente en sus teléfonos e inmediatamente analizarlos con Dolphingemma. Esto hace que la tecnología sea más accesible y ayuda a reducir los costos de investigación.
Además, Dolphingemma está integrado en el sistema de chat (telemetría de aumento de la audición de cetáceos), que permite a los investigadores jugar sonidos sintéticos similares a los delfines y observar respuestas. Esto podría conducir al desarrollo de un vocabulario compartido al permitir la comunicación bidireccional entre delfines y humanos.
Implicaciones más amplias y el plan futuro de Google
El desarrollo del delfingemma es significativo no solo para comprender la comunicación de los delfines sino también para avanzar en el estudio de la cognición y la comunicación animales. Al decodificar las vocalizaciones de los delfines, los investigadores pueden obtener ideas más profundas sobre las estructuras sociales, las prioridades y los procesos de pensamiento de los delfines. Esto no solo podría mejorar los esfuerzos de conservación al comprender las necesidades y preocupaciones de los delfines, sino que también tiene el potencial de ampliar nuestro conocimiento sobre la inteligencia y la conciencia de los animales.
Dolphingemma es parte de un movimiento más amplio que usa AI para explorar la comunicación animal, con esfuerzos similares en curso para especies como cuervos, ballenas y suricatas. Google planea liberar a Dolphingemma como un modelo abierto para la comunidad de investigación en el verano de 2025, con el objetivo de extender su aplicación a otras especies de cetáceos, como la naranja o los delfines giratorios, a través de un ajuste más fino. Este enfoque de código abierto fomentará la colaboración global en la investigación de la comunicación animal. Google también planea probar el modelo en el campo durante la próxima temporada, lo que podría ampliar aún más nuestra comprensión de los delfines manchados del Atlántico.
Desafíos y escepticismo científico
A pesar de su potencial, Dolphingemma también enfrenta varios desafíos. Las grabaciones oceánicas a menudo se ven afectadas por el ruido de fondo, lo que dificulta el análisis de sonido. Thad Starner de Georgia Tech, un investigador involucrado en este proyecto, señala que gran parte de los datos incluyen sonidos de océano ambiental, que requieren técnicas de filtrado avanzadas. Algunos investigadores también cuestionan si la comunicación de delfines realmente puede considerarse un lenguaje. Por ejemplo, Arik Kershenbaum, un zoólogo, sugiere que, a diferencia de la naturaleza compleja del lenguaje humano, las vocalizaciones de los delfines pueden ser un sistema más simple de señales. Thea Taylor, directora del Proyecto de Dolfín Sussex, plantea preocupaciones sobre el riesgo de capacitar involuntariamente a Dolphins para imitar los sonidos. Estas perspectivas destacan la necesidad de una validación rigurosa y una interpretación cuidadosa de las ideas generadas por IA.
El resultado final
La investigación de AI de Google sobre la comunicación de los delfines es un esfuerzo innovador que nos acerca a comprender las complejas formas en que los delfines interactúan entre sí y su entorno. A través de la inteligencia artificial, los investigadores detectan patrones ocultos en sonidos de delfines, ofreciendo nuevas ideas sobre sus sistemas de comunicación. Si bien quedan desafíos, el progreso realizado hasta ahora resalta el potencial de la IA en los estudios de comportamiento animal. A medida que esta investigación evoluciona, podría abrir puertas a nuevas oportunidades en conservación, estudios de cognición animal e interacción humana-animal.