logo

Actualidad

Lidera la transformación de las organizaciones para convertirlas en digital ecosystems

Cómo construir modelos analíticos con Machine Learning

29/05/2020
0 comentarios

El Machine Learning es una disciplina científica del ámbito de la Inteligencia Artificial que permite crear sistemas de aprendizaje automático. En este contexto, el aprendizaje se centra en la identificación de patrones complejos en millones de datos (Big Data). En realidad, la máquina que aprende es un algoritmo que revisa y analiza los datos y es capaz de predecir patrones, es decir, comportamientos futuros. La definición de estos comportamientos permite la toma de decisiones con una mínima intervención humana.

Conocer cómo aplicar los diferentes modelos y extraer conclusiones se ha convertido en una oportunidad laboral en el mercado laboral actual. Según recientes estudios, que analizan el impacto de la IA en las Organizaciones, el 83% de las empresas crearán nuevos puestos de trabajo gracias a la utilización de aplicaciones de IA, siendo necesaria la renovación de competencias profesionales para sacar el máximo partido a las inversiones en IA. En Three Points, hemos desarrollado para el Máster en Inteligencia Artificial que te permitirá aprovechar esta nueva oportunidad laboral.

El primer paso a la hora de definir un modelo analítico de Machine Learning es conocer adecuadamente el problema en el que posteriormente obtendremos el patrón, es decir, controlar las denominadas entradas y salidas esperadas. En este sentido, necesitamos definir cuál es el objetivo y qué es lo que intentamos predecir, cuáles son las características, el problema al que nos enfrentamos, la mejora que queremos obtener al aplicar el análisis del Machine Learning y, por supuesto, de dónde obtendremos los datos.

Todo proceso de Machine Learning se va a definir a partir de los datos que aportemos. Por ello, los datos son la base del éxito o del fracaso de todo el modelo analítico. Si los datos están sesgados o son erróneos, todo el modelo repetirá ese mismo patrón. Por esta razón, es muy importante contar con datos de calidad.

Además, dado que la recopilación de datos es esencial para el triunfo del modelo, ya que influirá en el desarrollo del mismo, cuantos más datos obtengamos, mejor será el rendimiento del modelo que definamos.

El tercer paso, es encontrar un medidor o un indicador del éxito del modelo. Para poder controlar algo es imprescindible poder medirlo, de lo contrario no será posible mejorarlo. En este sentido, generalmente negocio indica cuáles son las pautas a medir: precisión, exactitud, rapidez, magnitud, etc.

El siguiente paso es definir un patrón para observar los datos. Lo definiremos en base a los objetivos que hayamos definido en el paso anterior. Como ejemplo, podemos hablar de diferentes patrones que nos permitirán solucionar unos problemas u otros. Existen diferentes protocolos de actuación, los más conocidos son:

  1. Hold Out o set de validación, que consiste en mantener aparte una porción de los datos como conjunto de datos de prueba
  2. Validación K-Fold, que consiste en dividir los datos en K particiones del mismo tamaño. Para cada partición i, el modelo es entrenado con las restantes K-1 particiones, y evaluado en la propia partición i.
  3. Validación Iterada K-Fold con arrastre, se suele utilizar en los casos en los que no se cuenta con suficiente cantidad de datos. Consiste en aplicar la validación K-Fold varias veces, y “arrastrar” los datos cada vez antes de dividirlos en K particiones.

El quinto paso es la preparación de los datos. En esta etapa es necesario aportar al modelo una serie de aspectos que ayudarán a la obtención de los datos. Hablamos de aportar patrones como:

  • Qué hacer con los datos que se encuentran mal recogidos o que no tienen todos los campos bien definidos
  • Diferenciar entre datos nominales y datos categóricos
  • Escalación y selección de características relevantes.
  • División de los datos en conjuntos de entrenamiento, validación y pruebas.

Para ello, hay diferentes métodos de trabajo que ayudan a pulir los datos hasta obtener un resultado que el modelo puede procesar.

Una vez tengamos los datos preparados, ya podremos empezar a desarrollar un modelo de base. Este modelo, que no es el definitivo, sirve como referencia para medir el rendimiento del algoritmo y así poder controlar si va mejorando y poder ajustarlo en consecuencia. Para ello, necesitamos que los experimentos sean comparables, medibles y reproducibles.

Una vez identificado el modelo y definidos los pasos es el momento de empezar a ejecutar el modelo analítico que hemos creado y obtener resultados.  Sin embargo, todavía queda un largo camino por recorrer. La construcción de un modelo analítico es un proceso constante. En cuanto el modelo empiece a funcionar, habrá que entrenar a la máquina para poder visualizar una mejora en su funcionamiento.

Además, los modelos deben ser sometidos a evaluaciones regulares para comprobar la utilidad del mismo. Algunos modelos ofrecen resultados muy positivos en un inicio, pero a medida que avanzan en el tiempo su precisión deja de aumentar. En estos casos, en los no hayas obtenido una buena predicción en la evaluación y no hayas obtenido el mínimo porcentaje de exactitud requerido, deberás entrenar a tu modelo de Machine Learning nuevamente, pero, con una configuración de parámetros previa.

Finalmente, una vez superadas todas estas fases, puedes finalmente empezar a utilizar tu modelo de Machine Learning realizando predicciones reales en la vida real. A lo largo del camino habrás invertido muchas horas, pero la satisfacción de ver los resultados positivos del trabajo realizado es uno de los mayores logros para los profesionales de la Inteligencia Artificial y el Machine Learning.

Comentarios
Deja un comentario
Nombre y Apellidos
Email

© Three Points The School for Digital Business. Planeta Formación y Universidades. Todos los derechos reservados.

© Three Points The School for Digital Business. Planeta Formación y Universidades. Todos los derechos reservados.