DESCRIPCIÓN

Pertenecemos al departamento de informática de la multinacional IA&BD Consulting, la cual presta servicios a una conocida tele operadora de telefonía móvil.

Con la intención de actualizar la empresa a los nuevos tiempos, se ha contratado un nuevo Director General que nada más llegar ha comenzado a pedir una serie de informes de situación para poder hacerse una idea lo más clara posible de con qué se va a encontrar.

Por otro lado, el cliente necesita desarrollar un sistema que sea capaz de alertar de si un cliente está a punto de darse de baja.    

SISTEMAS DE BIG DATA

El departamento financiero nos han facilitado una excel con los datos administrativos, lo cual, resulta bastante engorroso a la hora de querer hacer consultas y analítica.

Las tareas a realizar son las siguientes:

– Crear una base de datos en MongoDB con sus colecciones y documentos.

– Un informe ejecutivo en Power BI para el gerente con todos los datos relevantes.

            

 

 

 

 

 

BIG DATA APLICADO

El cliente dispone de gran volumen de datos por los que deciden usar un entorno hadoop.

Las tareas a realizar son las siguientes:

– Los datos estarán guardados en Hive. Crear una base de datos y guardar todos los datos que se encuentran en el fichero.

Desde spark se va a acceder a los datos de hive para realizar una serie de cálculos:

Para poder acceder desde spark a hive se debe buscar el archivo hive-site.xml en el directorio spark y reemplazarlo por el archivo hive-site.xml que se encuentra en el directorio hive.

Realizar los siguientes cálculos desde spark y guardarlos en Hive.

– Calcular mediante un map reduce el número de llamadas por zona (sumar dia y noche)

Calcular el número de carga por plan de voz (Voice mail plan)

  

                                             

 

 

 

 

 

 

 

SISTEMAS DE APRENDIZAJE AUTOMÁTICO

Usad bigML para hacer la predicción: determinar qué algoritmo es más adecuado para solucionar el problema (supervisado o no supervisado). Usar más de un algoritmo supervisado y utilizar la mayor cantidad de funcionalidades de bigML.

Hay que explorar y analizar los datos con bigML. Finalmente, hay que argumentar el uso de cada algoritmo.

              

PROGRAMACIÓN DE INTELIGENCIA ARTIFICIAL

Haced el limpiado y adecuación de la BD en Python. Usar la plataforma de Kaggle de apoyo y utilizar ejemplos realizados en las actividades de clase.

                

 

 

 

Elegir el algoritmo que mejores resultados haya dado en bigML y realizar la predicción en Python. Para ello utilizar la librería scikit-learn, numpy, pandas, matplotlib y utilizar la programación estructurada.

                                              

                  

 

 

 

 

 

DOCUMENTACIÓN A ENTREGAR

 Documentación a entregar:

  1. Portada con el nombre del estudiante y el título de la actividad-reto, el número de la evaluación y la fecha de entrega.
  2. Índice principal.
  3. Referencias bibliográficas. 
  4. Anexos: estos son apartados opcionales que contienen elementos que complementan o amplían la información del trabajo.
  5. La documentación deberá estar escrita en tamaño de página A4 con los siguientes márgenes:

         Izquierdo: 3,0 cm.

         Derecho: 2,0 cm.

         Superior e inferior: 2,5 cm.

Texto principal:

         Arial 12, justificado, interlineado 1,5.

Notas al pie:

         Arial 10, justificado.

Tablas, figuras, imágenes:

         Título en la parte inferior: Arial 12, negrita, centrado.

Encabezado y pie de página:

         Todas las páginas llevarán un encabezado con  el nombre completo del estudiante y el título de la actividad-reto.

         Todas las páginas llevarán también un pie de página con el número de página.

  1. Presentación del reto: usar transparencias por ejemplo para ello.

 

 

Leave a reply