logo

Actualidad

Lidera la transformación de las organizaciones para convertirlas en digital ecosystems

¿Y si un algoritmo fuera el responsable de la canción del verano?

22/06/2021
0 comentarios

En los últimos años, no hemos parado de oír cómo la Inteligencia Artificial (IA) sigue avanzando y es capaz de realizar tareas cada vez más complejas; pero, ¿qué es la Inteligencia Artificial?

En una frase , podríamos definir la Inteligencia Artificial como el campo de las Ciencias de Computación que estudia cómo hacer que las máquinas (o programas de ordenador) realicen tareas simulando la inteligencia humana (aunque sea parcialmente).

Aunque se trata de un término que ya hace bastantes años que está acuñado, su auge está estrechamente relacionado con la gran capacidad y rendimiento de los modelos de Aprendizaje Automático basado en Deep Learning. Por lo tanto, es lícito decir (aunque quizás sobre vendiendo un poco el término) que la IA está adquiriendo cada vez más protagonismo y mejores capacidades gracias a estos modelos.

El auge del Aprendizaje Automático y el Deep Learning

Los modelos basados en Deep Learning son capaces de “realizar” tareas típicamente humanas con un rendimiento cercano (y a veces superior) al humano. Digo “realizar” entre comillas porque, en realidad, el modelo se entrena para resolver un problema típico del Aprendizaje Automático, como un problema de clasificación (quizás de imágenes). Con esa clasificación (de imágenes o detección de objetos), podemos desarrollar un software o aplicación que pueda, por ejemplo, controlar la entrada de las personas en un edificio basándose en la foto que tomamos de éstas al entrar. Esa es la tarea típicamente humana que podemos automatizar gracias a la IA.

Y este es solamente un ejemplo, pero tenemos muchos otros: asistentes virtuales que entienden lo que escribimos o decimos, recomendadores que nos ayudan a elegir la mejor serie para esta noche etc.

¿Podemos usar el Aprendizaje Automático para componer música?

Existen tareas que son tan humanas que parece muy difícil imaginar que un modelo de Aprendizaje Automático (o una IA, si abusamos un poco del lenguaje) sea capaz de hacerlas como, por ejemplo, componer música.

¿Podemos confirmar que la IA es capaz de componer una canción, con su ritmo, música, letra, etc? La respuesta corta es sí, es posible. Y, actualmente, hay varios ejemplos muy interesantes (y divertidos) como Daddy's Car (Sony CLS Reseach Lab), considerada la primera composición basada en la Inteligencia Artificial, o The Golden Age, compuesta por la plataforma AIVA.

Esa es la respuesta rápida. Pero vamos a romper una lanza a favor del ser humano. Aunque es cierto que hay modelos que componen canciones, éstos siguen estando lejos de lo que un compositor humano es capaz de hacer. Si no me creéis, os animo a echar un vistazo a este concurso de canciones creadas (con ayuda) de la IA.

¿Cómo podemos entrenar un modelo para componer canciones?

Estos modelos se entrenan para resolver un problema de Secuencia a Secuencia (“sequence to sequences”, o “sec2sec”, en inglés). La idea es que necesitamos un modelo que dada una secuencia de entrada (por ejemplo, un texto en inglés) nos genere una secuencia de salida adecuada (por ejemplo, la traducción del texto al castellano).

Three Points Inteligencia Artificial

Fuente: https://towardsdatascience.com/understanding-encoder-decoder-sequence-to-sequence-model-679e04af4346

 

Estos modelos suelen tener dos componentes principales, un “Encoder” o codificador que transporta la secuencia de entrada a un estado intermedio (o espacio latente), y un “Decoder” que utiliza este estado intermedio para ir generando la secuencia de salida.

Con esta idea en mente, se podría intentar generar una secuencia de notas musicales (o incluso sonidos MIDI) que tuvieran sentido. Un ejemplo de esta aproximación es Magenta, creada por el equipo de Tensorflow de Google. Si entráis en la plataforma, podréis crear vuestras propias composiciones bien con la aplicación Magenta Studio o, si tenéis ganas, directamente en Python con este notebook.

El tipo de modelos encoder-decoder que utilizaron fue de la familia de los Autoencoders (concretamente Variational Auto Encoders).

Three Points Inteligencia Artificial

Fuente: https://magenta.tensorflow.org/music-vae

 

La idea es parecida, un bloque encoder y otro decoder, pero entrenados de forma que el “input” y el “output” sea el mismo. Una vez entrenado el modelo, el Decoder se encargará de generar nuevas secuencias. Al modelo final lo bautizaron como MusicVAE.

Como ejemplo interesante de la aplicación de este modelo, podéis ver cómo un DJ genera nuevas composiciones. Aunque también podéis crear nuevas canciones mientras escribís cómo os sentís en ese momento…

Three Points Inteligencia Artificial

Interesante ¿verdad?, pues os recomiendo que también miréis NSynth, que también se encuentra bajo el proyecto Magenta, según sus propios creadores:

Basándose en investigaciones anteriores en este campo, Magenta creó NSynth (sintetizador neuronal). Es un algoritmo de aprendizaje automático que utiliza una red neuronal profunda para aprender las características de los sonidos y luego crear un sonido completamente nuevo basado en estas características.”

No obstante, existen otras aproximaciones más avanzadas que también quieren trabajar la armonía, la sonoridad de los instrumentos, la generación de voz humana y otros aspectos importantes en una composición.

OpenAI entrenó hace un tiempo un primer intento llamado MuseNet, donde los sonidos generados eran MIDI. Espectacular, pero limitada. Poco después entregó una nueva red profunda capaz de generar música de muchos formatos diferentes. A este modelo lo llamaron Jukebox. En este caso, la secuencia de entrada del modelo no son sonidos MIDI, sino sonidos en “bruto”. Esto le da mucha más riqueza al sonido generado.

¿Ganas de más? ¿Quieres más detalles? Aquí tenéis un excelente (y muy técnico) enlace sobre la generación de música con Aprendizaje Automático.

Como conclusión, hemos visto que los modelos generativos empiezan a realizar progresos realmente espectaculares en campos tan humanos como la composición musical. ¿Eso significa que ya no somos necesarios? ¡No, ni mucho menos! Las tareas humanas complejas, como la composición musical, escribir un poema o un libro están aún lejos del alcance de la Inteligencia Artificial actual. Los modelos generan composiciones aceptables, técnicamente correctas, pero sin el “sentimiento” humano.

Espero que el artículo os haya resultado interesante. Si os interesa el tema, os aconsejo que no le quitéis el ojo de encima ¡ya que estamos progresando a mucha velocidad!


 

Enrique Mora, Three Points

Enrique Mora 

Profesor del Máster en Big Data y Analytics

Artificial Intelligence Senior Solution Architect en Nestlé

 

Comentarios
Deja un comentario
Nombre y Apellidos
Email

Entradas relacionadas

Modelos de Inteligencia Artificial basados en el cliente

23/07/2021
No hay duda de que la Inteligencia Artificial nos rodea. Sin embargo, aún son muchas las personas que se muestran reacias ante este tipo de implementaciones. En el post de hoy repasamos varios modelos de negocio basados en IA y cómo se ha convertido en la gran apuesta de las compañías.

Deepfake, ¿el fin de la realidad?

23/07/2021
Durante los últimos años muchas de las aplicaciones móvil que se han popularizado nos permiten “jugar” con nuestras imágenes y vídeos, esto es gracias a los "Deepfake", un algoritmo basado en un modelo de Inteligencia Artificial que permite modificar los rasgos de una persona de manera muy sencilla. En el informe de hoy, Carlos Rodríguez Abellán, Senior Data Scientist en Telefónica, nos presenta todas las posibles aplicaciones de esta técnica y sus implicaciones morales.

El dilema de los vehículos autónomos

23/07/2021
Las tecnologías inteligentes están cambiando la forma en la que trabajamos, interactuamos, y también, la movilidad. No sólo cambian los vehículos, sino también el acto de conducir en si mismo: los coches autónomos han revolucionado la industria por completo. En el artículo de opinión de hoy, José Ramón Sanfiz Roy, Director del Máster en Inteligencia Artificial de Three Points, evalúa los riesgos y beneficios de esta tecnología emergente:

© Three Points The School for Digital Business. Planeta Formación y Universidades. Todos los derechos reservados.
Por cualquier consulta, escríbanos a info@threepoints.com

© Three Points The School for Digital Business. Planeta Formación y Universidades. Todos los derechos reservados.
Por cualquier consulta, escríbanos a info@threepoints.com