Gestión de datos con R
R es uno de los lenguajes de programación más utilizados en invesigación científica, machine learning, minería de datos y matemáticas financieras. Uno de sus puntos fuertes con respecto a otros lenguajes de programación son sus más de 2.000 librerías, las cuales proporcionan un amplio abanico de herramientas estadísticas y gráficas muy desarrolladas.
En este curso exploraremos algunas de estas librerías para resolver problemas de regresión, series temporales, machine learning, etc. Como paso previo, se tratará la lectura y escritura de ficheros de datos, así como la manipulación, preparación y limpieza de datos necesaria para posteriormente aplicar los algoritmos correspondientes.
El curso está dirigido a estudiantes de grado y máster de la Universidad de Navarra y de otras universidades interesados en abordar el área de la Ciencia de Datos con conocimientos básicos de uso de ordenadores y hojas de cálculo.
Al tratarse de un curso introductorio, no es necesario tener conocimientos previos de programación en R o en otro software.
Se requiere la instalación de R y RStudio para poder seguir el curso. Preferiblemente en sistema operativo Windows.
A continuación se detallan los contenidos a tratar el curso:
-
Introducción a R y RStudio
La primera parte del curso se dedicará a aspectos básicos de R, como la instalación del entorno de trabajo, la creación de proyectos, los fundamentos de programación en R y el manejo de librerías.
-
Estadística con R
R es un lenguaje especialmente adecuado para la programación estadística. Por ello, esta parte se dedicará a exponer las herramientas de estadística descriptiva que presenta, así como los gráficos estadísticos más comunes (histogramas, boxplot, etc. )
También se estudiarán las posibilidades que tiene R para el tratamiento de series temporales, centrándose en los modelos ARIMA para la predicción.
-
Lectura, escriturra y manipulación de datos
Se hará especial énfasis en la lectura y escritura de datos en ficheros .csv y .xlsx, en las operaciones sobre data frames y en la preparación y limpieza de datos.
-
Introducción al Machine Learning con R
Se introducirán como ejemplo algoritmos sencillos de machine learning. En particular se tratarán los algoritmos de regresión, utilizando las librerías que R tiene desarrolladas para este fin.
-
Gráficos avanzados con ggplot
Esta librería nos aporta mayor flexibilidad que R base para la parte gráfica. Se explorarán las posibilidades que nos ofrece y se utilizará también para hacer gráficos interactivos.
-
Rmarkdown
Como complemento al resto del curso, se hará una pequeña introducción a esta herramienta que nos permite presentar los resultados o el código desarrollado en R de una forma sencilla.
El curso se imparte de manera sincrónica online. Tiene una duración de 3 semanas, con clases teórico-prácticas y tutorías de 2 horas de duración.
El horario del curso es el siguiente: lunes, miércoles y viernes de 14.00 a 16.00 h.
Del 4 al 18 de octubre, las fechas siguientes:
-
Sesión 1: lunes, 4 de octubre
-
Sesión 2: miércoles, 6 de octubre
-
Tutoría: viernes, 8 de octubre
-
Sesión 3: lunes, 11 de octubre
-
Sesión 4: miércoles, 13 de octubre
-
Tutoría: viernes, 15 de octubre
-
Sesión 5: lunes, 18 de octubre
En las sesiones se propondrán ejercicios para que los inscritos trabajen por su cuenta, dado que en programación es fundamental el trabajo personal. Posteriormente se resolverán estos ejercicios en las sesiones de tutoría, donde se resolverán dudas sobre los ejercicios y sobre las sesiones.
La evaluación se realizará mediante 3 cuestionarios tipo test con preguntas sobre los temas tratados en las sesiones. El primero de ellos será sobre las sesiones 1 y 2, el segundo sobre las sesiones 3 y 4 y el tercero sobre la sesión 5. Dispondrán de varios días para contestar a cada cuestionario y podrán preguntar sus dudas sobre los mismos en las sesiones de tutoría.
La nota final del curso se calculará como la media aritmética de los 3 cuestionarios. Al finalizar el curso, se enviará un certificado acreditativo a los inscritos que lo hayan superado.
Todas las sesiones de explicación serán realizadas en la aplicación Zoom y éstas quedarán grabadas y disponibles para los alumnos.
Nota: se exigirá un mínimo de asistencia a las sesiones para considerarse aprobado.
El precio del curso es de 350€, existiendo distintos descuentos:
-
Alumnos de la Universidad de Navarra, 15% dto.: 297,50€
-
Familia numerosa, 8% dto.: 322€
Los pasos para formalizar la matrícula en el curso son:
1.Rellenar y enviar el formulario de preinscripción antes del miércoles, 22 de septiembre de 2021 a las 14.00h.
2. Se enviará un correo comunicando si ha sido admitido o no al curso el viernes 24 de septiembre.
3. En el caso de haber sido admitido, se les proporcionará el enlace a la pasarela de pagos para poder formalizar la matrícula. Es necesario que la matrícula esté formalizada antes del viernes 1 de octubre a las 14.00h, de no ser así, su plaza pasará a otro candidato.
La impartición del curso estará sujeta a un número mínimo de alumnos.