Show simple item record

dc.contributor.advisorCastillo Sequera, José Luis 
dc.contributor.advisorHee, Kim
dc.contributor.authorOrbegoso Barrantes, Daniel Gerald
dc.date.accessioned2018-02-02T14:19:13Z
dc.date.available2018-02-02T14:19:13Z
dc.date.issued2017
dc.identifier.urihttp://hdl.handle.net/10017/31994
dc.description.abstractCuando hablamos de “Dimensionality Reduction” en Informática o “Big Data” nos referimos al proceso de reducción de variables previamente examinadas de un conjunto de datos para poder así obtener un conjunto de variables menor que nos permitirá construir un modelo de datos igual o con mejor precisión y menor cantidad de datos. Con este propósito se aplican técnicas de “Feature Selection” y “Feature Extraction”, con la primera de ellas extraemos un conjunto de características importantes de un dataset mediante el uso de distintos algoritmos de “machine learning”, mientras que con la segunda obtendremos un nuevo conjunto de características obtenidas a partir de las características originales. En este trabajo de fin de grado hacemos un estudio empírico sobre las distintas metodologías para clasificación de problemas utilizando un dataset médico llamado NCS-1 de pacientes clínicos con distintas patologías médicas, estudiamos los distintos algoritmos que se pueden aplicar a cada caso determinado con dicho dataset, y finalmente con los datos obtenidos realizamos un benchmark que nos permite entender mejor los distintos modelos estudiados.es_ES
dc.description.abstractWhen we speak about Dimensionality reduction in informatics or big data, we refer to the process of reducing the number of random variables under consideration, and so, obtaining a set of principle variables which allow us to build a data model with the same or similar accuracy and a lower amount of data. For this purpose, we apply feature selection and feature extraction techniques. With feature selection we select a subset of the original feature set using techniques of machine learning, and with feature extraction we are going to build a new set of features from the original feature set. In this Project, we are going to make an empirical study about the different methodologies for classification problems using a medical dataset called NCS-1 of clinical patients with different medical pathologies, we study the different algorithms that can be applied for each case with this dataset, and finally with obtained data developing a Benchmark to understand the different applied models.en
dc.format.mimetypeapplication/pdfen
dc.language.isoengen
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectData miningen
dc.subjectDimensionality reductionen
dc.subjectPythonen
dc.subjectNCSIen
dc.subjectFeature engineeringen
dc.subjectMental healthen
dc.subjectDSM-III-R disordersen
dc.titleEmpirical study of dimensionality reduction methodologies for classification problemsen
dc.typeinfo:eu-repo/semantics/bachelorThesisen
dc.subject.ecienciaInformáticaes_ES
dc.subject.ecienciaComputer scienceen
dc.contributor.affiliationUniversidad de Alcalá. Escuela Politécnica Superiores_ES
dc.contributor.affiliationUniversität Frankfurt am Main. Databases and Information Systemsde
dc.type.versioninfo:eu-repo/semantics/acceptedVersionen
dc.description.degreeGrado en Ingeniería Informáticaes_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccessen


Files in this item

Thumbnail

This item appears in the following Collection(s)

Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Este ítem está sujeto a una licencia Creative Commons.