Se encuentra usted aquí

MAT17 - Descripción completa de curso

Descripción completa de curso

Descripción Curso: 14-DATAPYTHON

Código: 14-DATAPYTHON
Título: Análisis de datos con Python
Descripción:
  • El análisis de datos o análisis de la información nos permite conocer lo que ocurre en la sociedad. Las empresas que realizan análisis de datos consiguen entender a los consumidores, ofrecerles los productos que realmente desean o prever picos en el consumo. En particular, el análisis de los datos facilitará la toma de decisiones y permitirá contestar preguntas del tipo: ¿qué productos son más rentables?, ¿qué características tienen los consumidores de un determinado producto?, etc.
  • Hasta ahora, los lenguajes que más se usaban para realizar análisis y visualización de datos eran Matlab y R. Sin embargo en los últimos años Python se ha hecho muy popular entre los desarrolladores de aplicaciones y analistas de datos. Una de las razones es que Python es un lenguaje que se focaliza en tener una sintaxis limpia y fácil de leer. Posee librerías específicas que permiten realizar estadísticas sin tener que escribir complicados algoritmos. Además se valora mucho la potencia y eficiencia del lenguaje.
  • Una ventaja sustancial de Python con respecto a otros lenguajes es que es posible diseñar la totalidad del desarrollo en el mismo lenguaje, ya que posee las librerías necesarias para hacer un análisis completo de los datos: NumPy / SciPy, matplotlib, pandas y statmodels.
  • Otras librerías relacionadas con la generación de gráficos que están creciendo en popularidad son: seaborn, ggplot2, y Bokeh.
  • En estos días, las herramientas para casi todos los aspectos de la computación científica están fácilmente disponibles en Python. Y en un número creciente de casos, Python se está comiendo a la competencia.
  • El objetivo de este curso es introducir la programación en Python y en particular en las estructuras necesarias para realizar análisis y visualización de datos. Python no sólo es un lenguaje académicamente interesante y muy expresivo, es además, un lenguaje con mucho futuro.
Profesorado: Yolanda García Ruiz
Antonio Sarasa Cabezuelo
Ramón González del Campo Rodríguez Barbero
Programa:
  1. Introducción a Python y los distintos entornos de desarrollo
    • 1.1. El notebook de IPython – Jupyter.
  2. Elementos básicos del lenguaje.
    • 2.1. Tipos básicos, funciones, estructuras de datos, estructuras de control, diccionarios, ficheros
  3. Numerical Python.
    • 3.1. La librería Numpy. Arrays. Operaciones vectorizadas.
    • 3.2. Funciones universales.
    • 3.3. Entrada/salida.
    • 3.4. Proceso de datos usando arrays.
    • 3.5. Generación de números aleatorios.
  4. Panel Data sets
    • 4.1. La librería Pandas. Introducción a las estructuras en Pandas.
    • 4.2. Limpieza y transformación de datos. Tratamiento de datos perdidos. Operaciones merge y join.
    • 4.3. Estadística descriptiva en Pandas.
    • 4.4. Grupos y operación de agregación.
    • 4.5. Carga y almacenamiento de datos
  5. 5. Visualización de datos.
    • 5.1. Librería Matpltlib. Otras librerías: Seaborn, mpld3, bokeh.
Objetivos:
  • Presentar el entorno de desarrollo interactivo Jupyter, describiendo sus características, cómo instalarlo y usarlo.
  • Introducir las estructuras básicas de Python para el análisis de datos.
  • Presentar las librerías científicas de Python: Numpy, pandas y matplotlib.
  • Desarrollar pequeños proyectos de análisis que permitan poner en práctica lo aprendido.
Calendario: El período lectivo del curso se desarrollará entre los días 20 de Octubre y 20 de Diciembre de 2016.
Metodología:
  • El curso es fundamentalmente práctico, y está dirigido a introducir, practicar y usar el entorno propuesto: el lenguaje de programación Python y los notebooks de IPython.
  • Para ello, se proporcionan una serie de temas o unidades, cada uno de los cuales presenta unos conceptos básicos que se explican a través de un texto, el cual a su vez va acompañado de una serie de ejemplos que ilustran didácticamente dichos conceptos.
  • Al final de cada tema se proponen una serie de ejercicios propuestos que deben ser realizados por los participantes. Los participantes tienen acceso a las soluciones de estos ejercicios, lo que les permitirá comprobar si han entendido los conceptos.
  • A lo largo del curso se proponen a su vez determinadas actividades cuya entrega es obligatoria para superar el curso y mediante los cuales los participantes deben aplicar los conocimientos introducidos en las unidades.
  • Todo este modelo está a su vez soportado a través de las herramientas de soporte a la educación virtual, mediante foros de consulta y colaborativos entre participantes, correo electrónico, etc.
Evaluación:
  • El seguimiento se realizará a través de las tareas y actividades propuestas por los tutores en cada uno de los temas.
  • La evaluación se realizará a través de un cuestionario online para los asistentes y a través de los correspondientes informes que emitirán los tutores y el coordinador de la actividad.
Otros:
  Descripción reducida del curso