Algoritmo de optimización probabilístico para resolver el problema de selección de modelo.

Dublin Core

Title

Algoritmo de optimización probabilístico para resolver el problema de selección de modelo.

Subject

510
Matemática física y química
Optimización matemática.
Algoritmos.
Análisis matemático.

Description

Tesis (Magíster en Ciencias de la Ingeniería)--Pontificia Universidad Católica de Chile, 2012
En aprendizaje supervisado existen numerosos algoritmos de preprocesamiento, selección de variables y clasificación, cada uno de los cuales tiene parámetros que permiten ajustarlo. El conjunto de combinaciones de algoritmos y parámetros (modelos) es enorme. Además, cada posible modelo debe ser entrenado y probado numerosas veces para una evaluación certera de su poder predictivo. Esta combinación de espacio de búsqueda grande y tiempo de evaluación elevado hace que encontrar un buen modelo puede tomar mucho tiempo. Por ejemplo, en el capítulo de experimentos, se puede ver que PSMS (un algoritmo de estado del arte, específicamente diseñado para la selección de modelo) requiere de más de dos semanas y media en la búsqueda de un modelo para un conjunto determinado de datos.
Esta investigación tiene como objetivo diseñar e implementar un algoritmo que logre encontrar el mejor modelo posible en un tiempo razonable. Para esto, se basa inicialmente en un algoritmo ya validado, llamado paramILS. Este, propuesto por Hutter et al (2009), es un algoritmo de optimización diseñado para calibrar parámetros de modo de disminuir el tiempo de ejecución de programas complejos. Luego, manteniendo la misma trayectoria de búsqueda de paramILS, se propone en esta tesis un nuevo algoritmo (PILS), el cual incorpora técnicas probabilísticas de modo de poder trabajar con una función objetivo estimada. Esta función objetivo retorna un estimador ruidoso de la calidad de cada modelo candidato, a cambio de una ganancia sustancial en tiempo de ejecución.
Los resultados mostraron que no solo se logró resolver el problema con un desempeño comparable al de algoritmos del estado del arte en este contexto, sino que se hizo utilizando entre el 5% y el 20% del tiempo requerido por los mismos.

Creator

Cortázar Morizon, Esteban

Date

2013-10-28T19:48:41Z
2013-10-28T19:48:41Z
2012

Contributor

Mery Quiroz, Domingo
Pontificia Universidad Católica de Chile. Escuela de Ingeniería

Rights

acceso abierto

Format

ix, 58 páginas
application/pdf

Language

es

Type

tesis de maestría

Identifier

10.7764/tesisUC/ING/1885
https://doi.org/10.7764/tesisUC/ING/1885
https://repositorio.uc.cl/handle/11534/1885