Por favor, use este identificador para citar o enlazar este ítem:
http://www.monografias.ufop.br/handle/35400000/5887
Título : | Cut the tails : uma abordagem para modelos de regressão com caudas pesadas. |
Autor : | Targa, Vinicius Nascimento |
metadata.dc.contributor.advisor: | Silva, Rodrigo César Pedrosa Felix, Josemar Coelho |
metadata.dc.contributor.referee: | Silva, Rodrigo César Pedrosa Felix, Josemar Coelho Moraes, Lauro Ângelo Gonçalves de Ferreira, Gabriel Bicalho |
Palabras clave : | Aprendizado de máquina Distribuição de caudas pesadas Estatística |
Fecha de publicación : | 2023 |
Citación : | TARGA, Vinicius Nascimento. Cut the tails: uma abordagem para modelos de regressão com caudas pesadas. 2023. 40 f. Monografia (Graduação em Ciências da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2023. |
Resumen : | A presença de dados que apresentam uma distribuição de caudas pesadas é mais comum do que se espera em determinadas áreas, pois um número considerável de casos no mundo real apresenta esse tipo de comportamento. O uso de técnicas de aprendizado de máquina tradicionais nesses tipos de distribuição pode não ser satisfatório o suficiente para gerar um modelo com acurácia considerável. O objetivo deste trabalho é criar uma abordagem que possa ser usada em distribuições de caudas pesadas, e que possa melhorar a acurácia dos modelos de aprendizado de máquina. Portanto, este trabalho propõe um método chamado "Cut the Tails", que, em sua metodologia, separa a distribuição da variável alvo de suas caudas pesadas e produz modelos de aprendizado de máquina separadamente para cada parte da distribuição. Ao comparar essa estratégia com as abordagens tradicionais de aprendizado de máquina, observou-se uma melhoria no erro absoluto médio percentual nos casos particulares que apresentaram curtose e assimetria elevados, sendo o melhor caso uma redução de erro de aproximadamente 48% ao usar a estratégia proposta. |
metadata.dc.description.abstracten: | The presence of data exhibiting heavy-tailed distributions is more common than expected in certain areas, as a considerable number of real-world cases display this type of behavior. The utilization of traditional machine learning techniques on these types of distributions may not yield a satisfactory outcome in generating a model of substantial accuracy. The aim of this study is to formulate an approach applicable to heavy-tailed distributions, which can enhance the accuracy of machine learning models. Hence, this research introduces a method named "Cut the Tails," which, in its methodology, segregates the target variable's distribution from its heavy tails and generates separate machine learning models for each segment of the distribution. By comparing this strategy with conventional machine learning approaches, an improvement in the mean absolute percentage error was observed in specific cases exhibiting high kurtosis and skewness. The most favorable case demonstrated an error reduction of approximately 48% when employing the proposed strategy. |
URI : | http://www.monografias.ufop.br/handle/35400000/5887 |
Aparece en las colecciones: | Ciência da Computação |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
MONOGRAFIA_CutTailsAbordagem.pdf | 1,29 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.