Versión imprimible Curso Académico
Tratamiento Inteligente de Datos
Curso 2017/18
1. Datos Descriptivos de la Asignatura
ASIGNATURA: Tratamiento Inteligente de Datos CÓDIGO: 139263125
- Centro: Escuela Superior de Ingeniería y Tecnología
- Titulación: Grado en Ingeniería Informática
- Plan de Estudios: 2010 (publicado en 21-03-2011)
- Rama de conocimiento: Ingeniería y Arquitectura
- Itinerario/Intensificación: Computación
- Departamento/s: - Área/s de conocimiento:
  • Ciencia de la Computación e Inteligencia Artificial
  • Ingeniería Telemática
  • Lenguajes y Sistemas Informáticos
- Curso: 3
- Carácter: Obligatoria
- Duración: Cuatrimestral
- Créditos ECTS: 6.0
- Horario: http://www.ull.es/view/centros/etsii/Tercero_5/es
- Dirección web de la asignatura: http://www.campusvirtual.ull.es
- Idioma: Español e Inglés


2. Requisitos para cursar la asignatura
No existen requisitos para cursar la asignatura


3. Profesorado que imparte la asignatura
Profesor/a Coordinador/a: JOSE MARCOS MORENO VEGA
- Grupo: Grupos completo, PA y PE
- Departamento: Ingeniería Informática y de Sistemas
- Área de conocimiento: Ciencia de la Computación e Inteligencia Artificial
- Lugar Tutoría: Despacho 84, cuarta planta, Edificio de las secciones de Física y Matemáticas
- Horario Tutoría: Miércoles de 10:00 a 14:00 y jueves de 12:00 a 14:00 (Las tutorías son susceptibles de cambios en función de los compromisos académicos del profesor. El horario de tutorías aparecerá siempre actualizado en el espacio del profesor en el aula virtual del campus Ull. Además, se informará de los cambios a los alumnos)
- Teléfono (despacho/tutoría): 922318175
- Correo electrónico: jmmoreno@ull.es
- Dirección web docente: http://www.campusvirtual.ull.es
Profesor/a: AIRAM EXPOSITO MARQUEZ
- Grupo: Grupo PE
- Departamento: Ingeniería Informática y de Sistemas
- Área de conocimiento: Ciencia de la Computación e Inteligencia Artificial
- Lugar Tutoría: Laboratorio DSIC3-4, Escuela Superior de Ingeniería y Tecnología
- Horario Tutoría: Miércoles de 10:00 a 11:30 (Las tutorías son susceptibles de cambios en función de los compromisos académicos del profesor. El horario de tutorías aparecerá siempre actualizado en el espacio del profesor en el aula virtual del campus Ull. Además, se informará de los cambios a los alumnos)
- Teléfono (despacho/tutoría):
- Correo electrónico: aexposim@ull.es
- Dirección web docente: http://www.campusvirtual.ull.es


4. Contextualización de la asignatura en el plan de estudio
- Bloque formativo al que pertenece la asignatura: Itinerario 1: Computación
- Perfil profesional: Ingeniero Técnico en Informática


5. Competencias
Competencias Generales
[CG4] Capacidad para definir, evaluar y seleccionar plataformas hardware y software para el desarrollo y la ejecución de sistemas, servicios y aplicaciones informáticas, de acuerdo con los conocimientos adquiridos según lo establecido en el apartado 5 de este anexo.
[CG6] Capacidad para concebir y desarrollar sistemas o arquitecturas informáticas centralizadas o distribuidas integrando hardware, software y redes de acuerdo con los conocimientos adquiridos según lo establecido en el apartado 5 de este anexo.
[CG9] Capacidad para resolver problemas con iniciativa, toma de decisiones, autonomía y creatividad. Capacidad para saber comunicar y transmitir los conocimientos, habilidades y destrezas de la profesión de Ingeniero Técnico en Informática.
Tecnología Específica / Itinerario: Computación
[C45] Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
Transversales
[T7] Capacidad de comunicación efectiva (en expresión y comprensión) oral y escrita, con especial énfasis en la redacción de documentación técnica.
[T10] Capacidad de integrarse rápidamente y trabajar eficientemente en equipos unidisciplinares y de colaborar en un entorno multidisciplinar.
[T21] Capacidad para el razonamiento crítico, lógico y matemático.
[T23] Capacidad de abstracción: capacidad de crear y utilizar modelos que reflejen situaciones reales.


6. Contenidos de la asignatura
Contenidos teóricos y prácticos de la asignatura
Módulo: INTRODUCCIÓN

Profesorado: J. Marcos Moreno Vega (teoría y práctica)

- Tema 1. El proceso de extracción de conocimiento en bases de datos

Módulo: CLASIFICACIÓN

Profesorado: J. Marcos Moreno Vega (teoría y práctica)
Airam Expósito Márquez (práctica)

- Tema 2. Árboles de decisión y regresión
- Tema 3. Clasificadores bayesianos
- Tema 4. Aprendizaje de reglas

Módulo: AGRUPAMIENTO

Profesorado: J. Marcos Moreno Vega (teoría y práctica)
Airam Expósito Márquez (práctica)

- Tema 5. Agrupamiento basado en prototipos
- Tema 6. Agrupamiento jerárquico
- Tema 7. Agrupamiento basado en densidad

Módulo: MINERÍA DE PATRONES DE ASOCIACIÓN

Profesorado: J. Marcos Moreno Vega (teoría y práctica)
Airam Expósito Márquez (práctica)

- Tema 8. Reglas de asociación

Módulo: PREPROCESADO DE DATOS

Profesorado: J. Marcos Moreno Vega (teoría y práctica)
Airam Expósito Márquez (práctica)

- Tema 9. Preparación de datos
- Tema 10. Reducción de la dimensionalidad
Actividades a desarrollar en otro idioma
El software utilizado en la prácticas de laboratorio está documentado en inglés. También lo están los manuales y tutoriales que usarán los alumnos para el desarrollo de las prácticas asociadas a esta asignatura. Además, gran parte del material bibliográfico y de trabajo de la asignatura está escrito en este idioma. Se refuerza con ello la comprensión lectora de este idioma por parte de los alumnos.

Por otro lado, la memoria del proyecto (que se describe en el apartado Metodología y volumen del trabajo del estudiante) incluirá un breve resumen en inglés y los alumnos expondrán oralmente las conclusiones de su trabajo en este idioma. La evaluación de estas actividades se incluyen en la evaluación del proyecto, según lo descrito en el apartado Sistema de evaluación y calificación.


7. Metodología y volumen de trabajo del estudiante
Descripción
Los contenidos de la asignatura serán explicados por los profesores en las horas semanales presenciales de teoría. Durante las clases prácticas, se explicará la herramienta de tratamiento de datos usada como apoyo a los contenidos teóricos. Esta herramienta será usada por los alumnos para realizar las actividades prácticas que así lo requieran.

Para fomentar la comprensión del proceso de extracción de conocimiento y de las técnicas asociadas, se usará la metodología de enseñanza aprendizaje basada en proyectos. Se persigue con ello favorecer el aprendizaje efectivo, potenciar el trabajo autónomo, reforzar la motivación e implicación y favorecer la actitud reflexiva y crítica de los alumnos.

Se formarán grupos de alumnos que tendrán que recopilar, preparar y tratar datos con el propósito de extraer conocimiento útil de los mismos. Además, deberán interpretar los resultados obtenidos y proponer estrategias para difundir y usar el conocimiento extraído. Se procurará que los datos a analizar sean de interés para el alumnado. Así, se usarán datos sobre hábitos de compra, perfiles de usuarios de algún servicio o relativos a variables económicas o medioambientales.

El trabajo realizado se recogerá en una memoria del proyecto que deberá ser presentada oralmente al finalizar el cuatrimestre. La memoria escrita y la exposición se usarán como base para la evaluación continua. Otras actividades complementarias a desarrollar por el alumno son la participación en foros, la búsqueda de información reciente sobre el tratamiento de datos y sus implicaciones legales, éticas y morales y la realización de ejercicios. Algunas de estas actividades se realizarán virtualmente.

En dos semanas del cuatrimestre los alumnos expondrán a los profesores, en una tutoría en grupo, la marcha del proyecto. En estas tutorías los profesores evaluarán la marcha del proyecto y sugerirán, en su caso, acciones de mejora.

La asignatura participa en el Programa de Apoyo a la Docencia Presencial mediante Herramientas TIC. Algunas de las tareas que se realizarán en el aula virtual son la participación en foros y la realización de cuestionarios.

Actividades formativas en créditos ECTS, su metodología de enseñanza-aprendizaje y su relación con las competencias que debe adquirir el estudiante
Actividades formativas Horas presenciales Horas de trabajo autónomo Total Horas Relación con competencias
Clases teóricas  16.00      16  [T23], [C45]
Clases prácticas (aula / sala de demostraciones / prácticas laboratorio)  14.00      14  [T21], [T23], [C45]
Realización de seminarios u otras actividades complementarias  8.00   10.00   18  [T7], [T10], [T21]
Realización de trabajos (individual/grupal)  7.00   40.00   47  [CG4], [CG6], [CG9], [T7], [T10], [T21], [T23], [C45]
Estudio/preparación clases teóricas     10.00   10  [T21], [T23], [C45]
Realización de exámenes  3.00      3  [CG4], [CG6], [CG9], [T7]
Asistencia a tutorías  7.00      7  [C45]
Estudio autónomo individual o en grupo     30.00   30  [CG4], [CG6], [CG9], [T10], [T21], [T23]
Exposición oral por parte del alumno  5.00      5  [T7], [T10]
Total horas  60   90   150 
Total ECTS  6 


8. Bibliografía / Recursos
Bibliografía básica

José Hernández Orallo, M.José Ramírez Quintana, Cesar Ferri Ramírez. Introducción a la Minería de Datos Editorial Pearson, 2004.

Ethem Alpaydin, Introduction to Machine Learning, The MIT Press, 2004

Ian H. Witten, Eibe Frank, Mark A. Hall, Data Mining, Morgan Kaufmann, 2011

P. N. Tan, M. Steinbach, V. Kumar. Introduction to Data Mining, Addison-Wesley, 2006

C. C. Data Mining. The Textbook. Springer, 2015

S. García, J. Luengo, F. Herrera. Data preprocessing in Data Mining. Springer. 2015
Bibliografía complementaria
Tom Mitchell, Machine Learning, McGraw Hill, 1997

Trevor Hastie, Robert Tibshirani, Jerome Friedman. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer, 2009


9. Sistema de evaluación y calificación
Descripción
La Evaluación de la asignatura se rige por el Reglamento de Evaluación y Calificación de la Universidad de La Laguna (BOC de 19 de enero de 2016), o el que la Universidad tenga vigente, además de por lo establecido en la Memoria de Verificación inicial o posteriores modificaciones.

Se emplea un sistema de evaluación continua que contempla la realización de las siguientes actividades:

a) el proyecto descrito en el apartado Metodología y volumen de trabajo del alumno,
b) ejercicios prácticos individuales o en grupo, y
c) participación en foros.

La calificación del proyecto tiene un peso del 70% de la nota (20% corresponde a la memoria y defensa del proyecto (incluidas las actividades desarrolladas en inglés que se describen en el apartado Metodología y volumen de trabajo del alumno); 50% al análisis de los datos realizado en el laboratorio), correspondiendo el 30% restante a los ejercicios prácticos y a la participación en los foros.

Todas las actividades de la evaluación continua tienen carácter obligatorio.

En el apartado Cronograma/calendario de la asignatura se recogen las fechas estimadas de presentación de las diferentes actividades. Los resultados de las mismas serán comunicados a los alumnos aproximadamente 15 días después de su presentación.

Los alumnos que no superen la asignatura por el sistema de evaluación continua deberán presentarse, en las convocatorias y fechas establecidas para ello por la Universidad de La Laguna y la Escuela Superior de Ingeniería y Tecnología, a una prueba de evaluación alternativa. Esta consistirá en la realización de unos ejercicios prácticos y en la presentación y defensa, de manera individual, del proyecto descrito en el apartado Metodología y volumen de trabajo. La calificación de las actividades de carácter obligatorio obtenida en la evaluación continua se incorporarán a la calificación final de la prueba alternativa.

Tal como se ha indicado anteriormente, el software utilizado en la prácticas de laboratorio, así como los manuales y tutoriales que usarán los alumnos para el desarrollo de las mismas, están documentados en inglés. Se evaluará la compresión de los mismos en la calificación de prácticas.

En la tabla siguiente se muestra la ponderación de las diferentes actividades de la evaluación continua.

Estrategia Evaluativa
TIPO DE PRUEBA COMPETENCIAS CRITERIOS PONDERACIÓN
Trabajos y proyectos  [CG4], [CG6], [CG9], [T7], [T21], [T23], [C45]   - Frecuencia y pertinencia de las intervenciones en los foros.
- Adecuación de las respuestas dadas a los ejercicios y claridad de redacción de las mismas. 
 30% 
Informes memorias de prácticas  [CG4], [CG6], [CG9], [T7], [T10], [T21], [T23], [C45]   - Memoria/s: estructura, calidad y claridad de la redacción, fuentes consultadas, rigor en el análisis de los datos y coherencia de las conclusiones.
- Defensa oral: estructura de la exposición, lenguaje empleado y respuesta a las preguntas. 
 20% 
Valoración de las actividades prácticas en el laboratorio  [CG4], [CG6], [CG9], [T7], [T10], [T21], [T23], [C45]   - Grado de conocimiento adquirido en el manejo de las herramientas para el tratamiento inteligente de datos.
- Rigor en el análisis de los datos y coherencia de las conclusiones. 
 50% 


10. Resultados de Aprendizaje
 Diseñar, implementar y evaluar técnicas de aprendizaje computacional y de extracción automática de conocimiento a partir de grandes volúmenes de datos.

En el contexto de un grupo de trabajo, recopilar, analizar y estructurar documentación técnica sobre los aspectos claves de las técnicas de aprendizaje computacional y extracción automática de información y conocimiento a partir de grandes volúmenes de datos para realizar una síntesis por escrito y una presentación oral
 


11. Cronograma / calendario de la asignatura
Descripción
 Los contenidos de la asignatura serán explicados por el profesor en las horas semanales presenciales de teoría. Para afianzar estos contenidos, se han programado diferentes tareas prácticas que los alumnos deberán hacer individualmente y de forma autónoma. En el enunciado de estas tareas se especificarán los criterios de evaluación y, en su caso, la fecha límite de entrega.

Se pondrá a disposición de los alumnos las transparencias de clase, ejemplos y enlaces a material complementario.

Además, los alumnos deberán participar en dos foros online dedicados, respectivamente, a los “Límites del tratamiento inteligente de datos” e “Importancia, alcance, retos y oportunidades del tratamiento de datos”. El profesor enlazará en el aula virtual lecturas y material recomendados para que los alumnos puedan preparar adecuadamente sus intervenciones en el foro.

La asignatura sigue una metodología de enseñanza aprendizaje basada en proyectos por lo que los alumnos deberán realizar, en grupo, un proyecto en el que tendrán que recopilar, preparar y tratar datos con el propósito de extraer conocimiento útil de los mismos. Además, deberán interpretar los resultados obtenidos y proponer estrategias para difundir y usar el conocimiento extraído. Semanalmente se irá trabajando en este proyecto que deberá ser expuesto oralmente al finalizar el cuatrimestre. Las semanas 6 y 11 los alumnos presentarán al profesor, en un seminario en grupo reducido, la marcha del proyecto. En estos seminarios el profesor evaluará la marcha del proyecto y sugerirá, en su caso, acciones de mejora.

El cronograma que se muestra tiene carácter orientativo, de modo que el profesor podrá modificar la planificación propuesta si así fuese necesario para una correcta marcha del proceso de enseñanza-aprendizaje. 


Segundo Cuatrimestre
SEMANA Temas Actividades de
enseñanza aprendizaje
Horas
de trabajo
presencial
Horas
de trabajo
autónomo
Total
Semana 1:  Tema 1   Explicar el tema 1 (El proceso de extracción de conocimiento en bases de datos)

Explicar las principales funcionalidades y entornos de la herramienta WEKA

Tarea 1: Participar en el foro Límites del tratamiento de datos (Actividad online) 
 4.00   3.00   7 
Semana 2:  Tema 2   Explicar el tema 2 (Árboles de decisión y regresión).

Explicar los módulos de WEKA dedicados a árboles de decisión y regresión

Describir el proyecto que los alumnos deben realizar en grupo 
 4.00      4 
Semana 3:  Tema 2   Explicar el tema 2 (Árboles de decisión y regresión)

Tarea 2 : Árboles de decisión y regresión 1

Desarrollo del proyecto 
 4.00   6.00   10 
Semana 4:  Tema 2   Explicar el tema 2 (Árboles de decisión y regresión)

Tarea 3: Árboles de decisión y regresión 2

Desarrollo del proyecto 
 4.00   5.00   9 
Semana 5:  Tema 3   Explicar el tema 3 (Clasificadores bayesianos)

Explicar los módulos de WEKA dedicados a clasificadores bayesianos

Tarea 4: Clasificadores bayesianos

Enunciar la tarea 4: Clasificadores bayesianos

Desarrollo del proyecto 
 4.00   4.00   8 
Semana 6:  Tema 4   Explicar el tema 4 (Aprendizaje de reglas)

Explicar los módulos de WEKA dedicados a aprendizaje de reglas

Tarea 5: Aprendizaje de reglas

Participar en la tutoría en grupo reducido "Avances del proyecto"

Desarrollo del proyecto 
 4.00   6.00   10 
Semana 7:  Tema 5   Explicar el tema 5 (Agrupamiento basado en prototipos)

Explicar los módulos de WEKA dedicados al agrupamiento basado en prototipos

Tarea 5: Aprendizaje de reglas

Enunciar la tarea 4: Clasificador bayesiano
Desarrollo del proyecto 
 4.00   6.00   10 
Semana 8:  Tema 5   Explicar el tema 5 (Agrupamiento basado en prototipos)

Tarea 6: Agrupamiento basado en prototipos

Desarrollo del proyecto

 
 4.00   5.00   9 
Semana 9:  Tema 6   Explicar el tema 6 (Agrupamiento jerárquico)

Explicar los módulos de WEKA dedicados al agrupamiento jerárquico

Tarea 7: Agrupamiento jerárquico

Desarrollo del proyecto
 
 4.00   6.00   10 
Semana 10:  Tema 7   Explicar el tema 7 (Agrupamiento basado en densidad)

Explicar los módulos de WEKA dedicados al agrupamiento basado en densidad

Tarea 8. Agrupamiento basado en densidad

Desarrollo del proyecto 
 4.00   5.00   9 
Semana 11:  Tema 8   Explicar el tema 8 (Reglas de asociación)

Explicar los módulos de WEKA dedicados a la minería de reglas de asociación

Tarea 9: Participar en la tutoría en grupo reducido "Avances del proyecto"

Desarrollo del proyecto 
 4.00   6.00   10 
Semana 12:  Tema 8   Explicar el tema 8 (Reglas de asociación)

Tarea 10: Reglas de asociación

Desarrollo del proyecto 
 4.00   6.00   10 
Semana 13:  Tema 9   Explicar el tema 9 (Preprocesado de datos)

Desarrollo del proyecto 
 4.00   5.00   9 
Semana 14:  Tema 10   Explicar el tema 10 (Reducción de la dimensionalidad)

Tarea 11: Participar en el foro “Importancia, alcance, retos y oportunidades del tratamiento de datos” (Actividad online)

Desarrollo del proyecto 
 4.00   7.00   11 
Semana 15:  Tema 10   Explicar el tema 10 (Reducción de la dimensionalidad)

Desarrollo del proyecto 
 2.00   4.00   6 
Semanas 16 a 18:  Evaluación   Preparación y realización de las pruebas evaluativas (redacción de la memoria, presentación del proyecto, prueba única (en su caso))   2.00   16.00   18 
Total horas 60 90 150

Fecha de última modificación: 31-10-2017
Fecha de aprobación: 27-07-2017