Versión imprimible Curso Académico
Extracción y Explotación de la Información
Curso 2017/18
1. Datos Descriptivos de la Asignatura
ASIGNATURA: Extracción y Explotación de la Información CÓDIGO: 135750913
- Centro: Escuela Superior de Ingeniería y Tecnología
- Titulación: Máster Universitario en Ingeniería Informática
- Plan de Estudios: 2014 (publicado en 06-06-2014)
- Rama de conocimiento: Ingeniería y Arquitectura
- Itinerario/Intensificación: Ingeniería de Sistemas de Software
- Departamento/s: - Área/s de conocimiento:
  • Ciencia de la Computación e Inteligencia Artificial
  • Estadística e Investigación Operativa
- Curso: 1
- Carácter: Optativa
- Duración: Cuatrimestral
- Créditos ECTS: 6.0
- Horario: http://www.ull.es/view/master/ingenieriainformatica/Horarios/es
- Dirección web de la asignatura: http://campusvirtual.ull.es
- Idioma: Castellano e Inglés


2. Requisitos para cursar la asignatura
No existen requisitos para cursar la asignatura


3. Profesorado que imparte la asignatura
Profesor/a Coordinador/a: CARLOS PEREZ GONZALEZ
- Grupo: Teoría grupo 2, Práctica grupo PE201
- Departamento: Matemáticas, Estadística e Investigación Operativa
- Área de conocimiento: Estadística e Investigación Operativa
- Lugar Tutoría: 2ª planta de la Torre Profesor Agustín Arévalo (Av. De La Trinidad)
- Horario Tutoría: Jueves 16:00-19:00
- Teléfono (despacho/tutoría): 922318094
- Correo electrónico: cpgonzal@ull.es
- Dirección web docente: http://www.campusvirtual.ull.es
Profesor/a: JOSE MARCOS MORENO VEGA
- Grupo: Teoría grupo 2, Práctica grupo PE201
- Departamento: Ingeniería Informática y de Sistemas
- Área de conocimiento: Ciencia de la Computación e Inteligencia Artificial
- Lugar Tutoría: Despacho 84, cuarta planta, edificio de las secciones de Física y Matemáticas
- Horario Tutoría: Miércoles de 10:00 a 14:00 y jueves de 12:00 a 14:00. (Las tutorías son susceptibles de cambios en función de los compromisos académicos del profesor. El horario de tutorías aparecerá siempre actualizado en el espacio del profesor en el aula virtual del campus Ull. Además, se informará de los cambios a los alumnos)
- Teléfono (despacho/tutoría): 922318175
- Correo electrónico: jmmoreno@ull.es
- Dirección web docente: http://www.campusvirtual.ull.es


4. Contextualización de la asignatura en el plan de estudio
- Bloque formativo al que pertenece la asignatura: Módulo de Tecnologías Informáticas / Especialidad Ingeniería de Sistemas de Software
- Perfil profesional: Ingeniero en Informática


5. Competencias
Específicas
[SL1] Conocer y saber aplicar el funcionamiento del mundo del software libre y sistemas abiertos en sus aspectos legal, normativo y económico en relación con: los modos de licenciamiento, el estatus legal en el marco de la legislación de propiedad intelectual y sus implicaciones para los modelos de negocio y desarrollo.
[SL3] Comprender, diseñar, evaluar y aplicar tecnologías, herramientas, recursos, estándares en el marco del desarrollo de software y su implantación en sistemas y entornos libres.
[TI_1] Capacidad para modelar, diseñar, definir la arquitectura, implantar, gestionar, operar, administrar y mantener aplicaciones, redes, sistemas, servicios y contenidos informáticos
[TI_2] Capacidad de comprender y saber aplicar el funcionamiento y organización de Internet, las tecnologías y protocolos de redes de nueva generación, los modelos de componentes, software intermediario y servicios
[TI_4] Capacidad para diseñar, desarrollar, gestionar y evaluar mecanismos de certificación y garantía de seguridad en el tratamiento y acceso a la información en un sistema de procesamiento local o distribuido
[TI_5] Capacidad para analizar las necesidades de información que se plantean en un entorno y llevar a cabo en todas sus etapas el proceso de construcción de un sistema de información
[TI_9] Capacidad para aplicar métodos matemáticos, estadísticos y de inteligencia artificial para modelar, diseñar y desarrollar aplicaciones, servicios, sistemas inteligentes y sistemas basados en el conocimiento
Generales
[CO1] Capacidad para proyectar, calcular y diseñar productos, procesos e instalaciones en todos los ámbitos de la Ingeniería Informática
[CO3] Capacidad para dirigir, planificar y supervisar equipos multidisciplinares
[CO4] Capacidad para el modelado matemático, cálculo y simulación en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación, desarrollo e innovación en todos los ámbitos relacionados con la Ingeniería en Informática
[CO7] Capacidad para la puesta en marcha, dirección y gestión de procesos de fabricación de equipos informáticos, con garantía de la seguridad para las personas y bienes, la calidad final de los productos y su homologación
[CO8] Capacidad para la aplicación de los conocimientos adquiridos y de resolver problemas en entornos nuevos o poco conocidos dentro de contextos más amplios y mulitidisciplinares, siendo capaces de integrar estos conocimientos


6. Contenidos de la asignatura
Contenidos teóricos y prácticos de la asignatura
Profesor/a: Carlos Pérez González
Temas (epígrafes):
Módulo I. Almacenamiento, recuperación y gestión avanzada de la información. Visualización y presentación de la información
- Tema 1: Obtención dinámica de información.
- Tema 2: Introducción a Hadoop (arquitectura, comandos básicos, operaciones map y reduce,…).
- Tema 3: Análisis de datos masivos con Hadoop.
- Tema 4: Introducción a Spark. Visualización de información (representación de datos geospaciales y gráficos interactivos).
- Tema 5: Introducción a Docker. Utilización de librerías javascript para gráficos estadísticos (d3.js, Highcharts).

Profesor/a: J. Marcos Moreno Vega
Temas (epígrafes):
Módulo II. Análisis exploratorio de la información. Modelos avanzados en el tratamiento de la información
- Tema 6: El proceso de extracción de conocimiento de bases de datos
- Tema 7: Modelos supervisados avanzados
- Tema 8: Modelos no supervisados avanzados
- Tema 9: Otros modelos avanzados
- Tema 10: Preprocesado de datos


Actividades a desarrollar en otro idioma
- Para cada uno de los temas se utilizarán recursos docentes en inglés que el alumno utilizará para su aprendizaje así como para el desarrollo de las actividades propuestas (en particular, los cuestionarios de evaluación y/o informes de prácticas), lo que supone, al menos, 0.5 créditos de la asignatura.


7. Metodología y volumen de trabajo del estudiante
Descripción
La metodología docente de la asignatura consistirá en:
1.- Clases magistrales: Donde el profesor desarrollará los conceptos que deben ser asimilados por el alumno.
Cada tema se ilustrará mediante ejemplos que permitirán combinar la teoría con la práctica. En estas clases se motivará la participación del alumnado mediante diversos métodos: realización de preguntas, discusión de técnicas y métodos, etc.

2.- Clases prácticas (aula o laboratorio): En las cuales los alumnos resolverán los problemas propuestos y desarrollarán los conceptos teóricos y metodologías explicadas utilizando diversas herramientas de extracción, tratamiento y explotación de datos y recursos que deberán aprender a utilizar para realizar las actividades propuestas.

Para facilitar el desarrollo de las diferentes competencias a partir de los contenidos de las clases teóricas y prácticas, se utilizará la metodología de enseñanza aprendizaje basada en proyectos. Se persigue con ello favorecer el aprendizaje efectivo, potenciar el trabajo autónomo, reforzar la motivación e implicación y favorecer la actitud reflexiva y crítica de los alumnos. Los alumnos tendrán que recopilar, preparar y tratar datos de interés para el alumnado con el propósito de extraer conocimiento útil de los mismos. Además, deberán interpretar los resultados obtenidos y proponer estrategias para difundir y usar el conocimiento extraído.

La evaluación continua de los alumnos tendrá en cuenta la realización de una memoria del proyecto que será presentada en forma oral al finalizar el cuatrimestre. Asimismo, otras actividades complementarias a desarrollar por el alumno son la participación en foros, la realización de diferentes tareas y la búsqueda de información reciente sobre las técnicas y métodos estudiados en clase.

El máster se imparte en la modalidad semipresencial para las clases prácticas, trabajos y proyectos, con lo cual el 50% de las actividades de la asignatura se desarrollarán de forma no presencial utilizando recursos síncronos como videos y tutorías online, así como otros materiales didácticos digitales. Por tanto, la realización de dichas actividades se llevará a cabo utilizando los recursos docentes y herramientas disponibles en el campus virtual. Los alumnos trabajarán con diversos materiales en el aula virtual de la asignatura, como transparencias, cuestionarios y guía de prácticas así como videoconferencia y chat, así como un listado de bibliografía y lecturas recomendadas. Con objeto de desarrollar estas actividades utilizando las herramientas disponibles en la Unidad de docencia Virtual, la asignatura participa en el Programa de Apoyo a la Docencia Presencial mediante Herramientas TIC en la modalidad A de apoyo a la docencia presencial de asignatura y al trabajo autónomo del alumnado.

El seguimiento de esta metodología permitirá que los alumnos, de forma autónoma y apoyándose puntualmente en las horas de tutoría dispuestas a tal efecto, sean capaces de resolver las actividades propuestas con el objeto de desarrollar y adquirir las habilidades y conocimientos exigidos en la asignatura.



Actividades formativas en créditos ECTS, su metodología de enseñanza-aprendizaje y su relación con las competencias que debe adquirir el estudiante
Actividades formativas Horas presenciales Horas de trabajo autónomo Total Horas Relación con competencias
Clases teóricas  9.00      9  [CO1], [CO3], [CO4], [CO7], [CO8], [SL1], [SL3], [TI_1], [TI_2], [TI_4], [TI_5], [TI_9]
Clases prácticas (aula / sala de demostraciones / prácticas laboratorio)  30.00      30  [CO4], [CO8], [SL1], [SL3], [TI_1], [TI_2], [TI_4], [TI_5], [TI_9]
Realización de seminarios u otras actividades complementarias  2.00      2  [CO4], [CO8], [SL1], [SL3], [TI_1], [TI_2], [TI_4], [TI_5], [TI_9]
Realización de trabajos (individual/grupal)  15.00   26.00   41  [CO4], [CO8], [TI_1], [TI_2], [TI_4], [TI_5], [TI_9]
Estudio/preparación clases teóricas     20.00   20  [CO4], [CO8], [TI_1], [TI_2], [TI_4], [TI_5], [TI_9]
Estudio/preparación clases prácticas     22.00   22  [CO4], [CO8], [TI_1], [TI_2], [TI_4], [TI_5], [TI_9]
Preparación de exámenes     10.00   10  [CO4], [CO8], [SL1], [SL3], [TI_1], [TI_2], [TI_4], [TI_5], [TI_9]
Realización de exámenes  4.00      4  [CO4], [CO8], [SL1], [SL3], [TI_1], [TI_2], [TI_4], [TI_5], [TI_9]
Preparación de Informes u otros trabajos  0.00   12.00   12  [CO4], [CO8], [SL1], [SL3], [TI_1], [TI_2], [TI_4], [TI_5], [TI_9]
Total horas  60   90   150 
Total ECTS  6 


8. Bibliografía / Recursos
Bibliografía básica
• Boris Lublinsky, Kevin T. Smith, Alexey Yakubovich - Hadoop. Soluciones Big Data, Ed. Anaya.
• Ben Fry - Visualizing Data: Exploring and Explaining Data with the Processing Environment, Ed. O'Reilly Media.
• Ian H. Witten, Eibe Frank, Mark A. Hall - Data Mining: Practical Machine Learning Tools and Techniques, Ed. Morgan Kaufmann.
• Foster Provost and Tom Fawcett. 2013. Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking (1st ed.). O'Reilly Media, Inc.. 



Otros recursos
• Campus virtual de la ULL: http://campusvirtual.ull.es
• Centro de cálculo de la Escuela Superior de Ingeniería y Tecnología
• Conexión a internet
• Presentaciones Power-Point, pizarra, software.



9. Sistema de evaluación y calificación
Descripción
La Evaluación de la asignatura se rige por el Reglamento de Evaluación y Calificación de la Universidad de La Laguna (BOC de 19 de enero de 2016), o el que la Universidad tenga vigente, además de por lo establecido en la Memoria de Verificación inicial o posteriores modificaciones.

Modalidad de evaluación continua:

La evaluación continua de la asignatura se aplicará en las convocatorias ordinarias del curso y se llevará a cabo mediante la realización de un conjunto de actividades individuales y un proyecto final (que podrá ser en grupo o individual dependiendo del número final de alumnos matriculados). Los alumnos deberán elaborar una memoria de dicho proyecto (en caso de un proyecto en grupo la deberán realizar en forma cooperativa) y tendrá que ser presentada de forma oral al finalizar el cuatrimestre (como actividad colaborativa) en las fechas establecidas para cada convocatoria. La memoria escrita y la exposición se usarán como base para la evaluación continua.
Las actividades individuales que los alumnos tendrán que llevar a cabo consistirán en la participación en foros así como la realización de cuestionarios, ejercicios y tareas entregables. Tanto el proyecto como los ejercicios serán calificados de 0-10 y se aplicarán las siguientes ponderaciones en el cálculo de la nota por evaluación continua:

A: Actividades (tareas y ejercicios) individuales: 30% de la calificación final. Estas actividades se realizarán a lo largo del cuatrimestre en ambos bloques de la asignatura.
B: Ejecución del proyecto y presentación: 70% de la calificación final. Esta prueba consistirá en la entrega de una memoria y su presentación en las fechas oficiales de las convocatorias del curso.

Se establecen la siguientes consideraciones importantes sobre la modalidad de evaluación continua:
1.- Es recomendable la realización de las actividades del apartado A dado que tienen un peso importante (30%) sobre la nota final, pero no condicionan la realización del proyecto final. Estas pruebas no tienen carácter de parciales y, por lo tanto, no son liberatorias. En cualquier caso, no se exige una nota mínima en la evaluación de dichas actividades para calcular la calificación final y, por tanto, no existe la posibilidad de recuperar las actividades individuales de estos apartados, ni siquiera en la primera convocatoria del curso.
2.- Si el alumno no presenta el proyecto en la fecha de la convocatoria no superará la evaluación continua y entonces la calificación en actas será NO PRESENTADO.
3.- La calificación obtenida en las actividades del apartado A será válida para todas las convocatorias del curso académico, salvo que el(la) alumno(a) renuncie expresamente a ellas presentando la solicitud correspondiente (disponible en el aula virtual de la asignatura) al profesor responsable, con un mínimo de 6 días antes de la celebración de cualquiera de las convocatorias oficiales. La renuncia tendrá carácter definitivo para el resto de convocatorias del curso y el alumno optaría por la modalidad de evaluación alternativa.

Modalidad de evaluación alternativa:

Si un alumno renuncia o no pudiese desarrollar normalmente las actividades previstas en la evaluación continua, entonces deberá realizar las siguientes pruebas:
C: Prueba compensatoria de las actividades del apartado A: 30% de la calificación final.
D: Ejecución de proyecto y presentación: 70% de la calificación final.

En este caso de evaluación alternativa hay que tener en cuenta que:
1.- La realización de estas pruebas tendrá lugar en las fechas oficiales de las convocatorias del curso. La prueba compensatoria incluirá contenidos desarrollados en las actividades propuestas en la modalidad de evaluación continua. La calificación obtenida en esta prueba compensatoria tendrá carácter definitivo para el resto de convocatorias del curso. La prueba del proyecto será similar a la descrita en el apartado B. La realización de estas pruebas será también la que se lleve a cabo en la convocatorias extraordinarias.

Las actividades desarrolladas en inglés se evalúan a través de la misma metodología que el resto de actividades, teniendo en cuenta que el inglés pudiera ser utilizado en el proyecto y en las propias actividades de evaluación (ejercicios, cuestionarios) tanto en la formulación de los enunciados como en su resolución por parte del alumnado.

IMPORTANTE: Aquellos alumnos/as que estén en 5ª ó 6ª convocatoria y NO hayan RENUNCIADO a corrección por un Tribunal deben saber que sólo podrán optar a la modalidad de evaluación única según la cual el Tribunal evaluará con una única prueba final que, en este caso, tendrá una nota máxima de 10 puntos.


Estrategia Evaluativa
TIPO DE PRUEBA COMPETENCIAS CRITERIOS PONDERACIÓN
Evaluación de teoría  [CO1], [CO3], [CO4], [CO7], [CO8], [SL1], [SL3], [TI_1], [TI_2], [TI_4], [TI_5], [TI_9]   - Participación en las actividades virtuales propuestas (frecuencia y pertinencia de las intervenciones en los foros).
- Realización de tareas planteadas (adecuación de las respuestas dadas a los ejercicios y claridad de redacción de las mismas).  
 30% 
Evaluación de prácticas, trabajos y proyectos  [CO1], [CO3], [CO4], [CO7], [CO8], [SL1], [SL3], [TI_1], [TI_2], [TI_4], [TI_5], [TI_9]   Evaluación de prácticas:
- Asistencia al 80% de las prácticas.
- Grado de conocimiento adquirido en el manejo de las herramientas para la extracción, tratamiento y explotación de información.
- Rigor en el análisis de los datos y coherencia de l 
 70% 


10. Resultados de Aprendizaje
 - Conocer, comprender y analizar los distintos modelos de extracción, tratamiento y explotación de información, así como las técnicas para su implementación eficiente y la metodología de evaluación de los mismos.
- Conocer, comprender y analizar las diferentes plataformas y herramientas de software así como los lenguajes de programación para la creación de los sistemas utilizados en el análisis y extracción de información.
- En un contexto práctico, identificar, recopilar y estructurar la información necesaria para diseñar un sistema que, analizando dicha información, ayude a alcanzar ciertos objetivos planteados.
- Usar las técnicas y métodos propuestos para resolver problemas reales de explotación de la información.

 


11. Cronograma / calendario de la asignatura
Descripción
 Debido a la complejidad de realizar un único cronograma existiendo varios grupos de prácticas, seminarios y tutorías distribuidos en diferentes semanas a lo largo del cuatrimestre, el siguiente cronograma recoge la distribución de actividades sólo de uno de los citados grupos a modo orientativo.
Para consultar el calendario de la asignatura y la distribución de las diferentes actividades presenciales programadas en la misma, se remite a los horarios publicados en la web y en los tablones de la Escuela.
La asignatura se desarrollará en la modalidad de semi-presencialidad en las semanas de clases prácticas no presenciales especificadas en el horario del máster fijado por la Escuela.
La distribución de las actividades por semana es orientativa y puede sufrir cambios según las necesidades de organización docente.
En la tabla siguiente se muestra la distribución de horas de trabajo presencial y autónomo por semana. Bajo el epígrafe horas de trabajo presencial se muestran tanto las horas de trabajo presencial como las de trabajo no presencial parte del alumno. Se ha hecho así por las limitaciones del portal eguia que, por el momento, no permite distinguir entre horas presenciales y no presenciales. En todo caso, las horas de trabajo presencial supondrán un 50% de las horas totales. 


Segundo Cuatrimestre
SEMANA Temas Actividades de
enseñanza aprendizaje
Horas
de trabajo
presencial
Horas
de trabajo
autónomo
Total
Semana 1:  1   Presentación de la asignatura (exposición de la metodología docente y sistema de evaluación).
Clases teóricas (Obtención dinámica de información). Asistencia a clases prácticas. y utilización de recursos de docencia no presencial. Propuesta o realización de actividades de evaluación (foros, tareas, cuestionarios,..).
 
 3.00   3.00   6 
Semana 2:  1   Clases teóricas (Introducción a Hadoop). Propuesta o realización de actividades de evaluación (foros, tareas, cuestionarios,..).   4.00   7.00   11 
Semana 3:  2   Clases teóricas (Análisis de datos masivos con Hadoop). Propuesta o realización de actividades de evaluación (foros, tareas, cuestionarios,..).   4.00   5.00   9 
Semana 4:  2,3   Clases teóricas (Análisis de datos masivos con Hadoop). Asistencia a clases prácticas y utilización de recursos de docencia no presencial.    4.00   5.00   9 
Semana 5:  3   Clases teóricas (Introducción a Spark). Propuesta o realización de actividades de evaluación (foros, tareas, cuestionarios,..).   4.00   7.00   11 
Semana 6:  4   Clases teóricas (Visualización de información). Propuesta o realización de actividades de evaluación (foros, tareas, cuestionarios,..).   4.00   5.00   9 
Semana 7:  4,5   Clases teóricas (Introducción a Docker y utilización de librerías javascript para gráficos estadísticos). Asistencia a clases prácticas y utilización de recursos de docencia no presencial.    4.00   5.00   9 
Semana 8:  6   Clases teóricas (El proceso de extracción de conocimiento de bases de datos). Propuesta o realización de actividades de evaluación (foros, tareas, cuestionarios,..).   3.00   7.00   10 
Semana 9:  7   Clases teóricas (Modelos supervisados avanzados) Propuesta o realización de actividades de evaluación (foros, tareas, cuestionarios,..).   4.00   5.00   9 
Semana 10:  7   Clases teóricas (Modelos supervisados avanzados) Asistencia a clases prácticas y utilización de recursos de docencia no presencial.    4.00   5.00   9 
Semana 11:  8   Clases teóricas (Modelos no supervisados avanzados) Propuesta o realización de actividades de evaluación (foros, tareas, cuestionarios,..).   4.00   7.00   11 
Semana 12:  8   Clases teóricas (Modelos no supervisados avanzados) Propuesta o realización de actividades de evaluación (foros, tareas, cuestionarios,..).   4.00   5.00   9 
Semana 13:  9   Clases teóricas (Otros modelos avanzados) Asistencia a clases prácticas y utilización de recursos de docencia no presencial.    4.00   5.00   9 
Semana 14:  10   Clases teóricas (Preprocesado de datos). Propuesta o realización de actividades de evaluación (foros, tareas, cuestionarios,..).   4.00   7.00   11 
Semana 15:     Clases teóricas: Síntesis del curso. Propuesta o realización de actividades de evaluación (foros, tareas, cuestionarios,..).   4.00   5.00   9 
Semanas 16 a 18:  Evaluación   Preparación y realización de proyecto.   2.00   7.00   9 
Total horas 60 90 150

Fecha de última modificación: 06-09-2017
Fecha de aprobación: 06-09-2017