Dublin Core
Title
Algoritmo de optimización probabilístico para resolver el problema de selección de modelo.
Subject
510
Matemática física y química
Optimización matemática.
Algoritmos.
Análisis matemático.
Description
Tesis (Magíster en Ciencias de la Ingeniería)--Pontificia Universidad Católica de Chile, 2012
En aprendizaje supervisado existen numerosos algoritmos de preprocesamiento, selección de variables y clasificación, cada uno de los cuales tiene parámetros que permiten ajustarlo. El conjunto de combinaciones de algoritmos y parámetros (modelos) es enorme. Además, cada posible modelo debe ser entrenado y probado numerosas veces para una evaluación certera de su poder predictivo. Esta combinación de espacio de búsqueda grande y tiempo de evaluación elevado hace que encontrar un buen modelo puede tomar mucho tiempo. Por ejemplo, en el capítulo de experimentos, se puede ver que PSMS (un algoritmo de estado del arte, específicamente diseñado para la selección de modelo) requiere de más de dos semanas y media en la búsqueda de un modelo para un conjunto determinado de datos.
Esta investigación tiene como objetivo diseñar e implementar un algoritmo que logre encontrar el mejor modelo posible en un tiempo razonable. Para esto, se basa inicialmente en un algoritmo ya validado, llamado paramILS. Este, propuesto por Hutter et al (2009), es un algoritmo de optimización diseñado para calibrar parámetros de modo de disminuir el tiempo de ejecución de programas complejos. Luego, manteniendo la misma trayectoria de búsqueda de paramILS, se propone en esta tesis un nuevo algoritmo (PILS), el cual incorpora técnicas probabilísticas de modo de poder trabajar con una función objetivo estimada. Esta función objetivo retorna un estimador ruidoso de la calidad de cada modelo candidato, a cambio de una ganancia sustancial en tiempo de ejecución.
Los resultados mostraron que no solo se logró resolver el problema con un desempeño comparable al de algoritmos del estado del arte en este contexto, sino que se hizo utilizando entre el 5% y el 20% del tiempo requerido por los mismos.
Creator
Cortázar Morizon, Esteban
Date
2013-10-28T19:48:41Z
2013-10-28T19:48:41Z
2012
Contributor
Mery Quiroz, Domingo
Pontificia Universidad Católica de Chile. Escuela de Ingeniería
Rights
acceso abierto
Format
ix, 58 páginas
application/pdf
Language
es
Type
tesis de maestría
Identifier
10.7764/tesisUC/ING/1885
https://doi.org/10.7764/tesisUC/ING/1885
https://repositorio.uc.cl/handle/11534/1885