Please use this identifier to cite or link to this item: http://www.monografias.ufop.br/handle/35400000/6898
Title: Análise de anomalias em operações silviculturais mecanizadas.
Authors: Souza, Henrique Neyffer de
metadata.dc.contributor.advisor: Sousa, Alexandre Magno de
metadata.dc.contributor.referee: Sousa, Alexandre Magno de
Araújo, Janniele Aparecida Soares
Jesus, Guilherme Luiz de
Keywords: Aprendizado do computador
Florestas - inovações tecnológicas
Florestas - manejo
Localização de falhas - engenharia
Mecanização agrícola
Issue Date: 2024
Citation: SOUZA, Henrique Neyffer de. Análise de anomalias em operações silviculturais mecanizadas. 2024. 91 f. Monografia (Especialização em Ciência de Dados) - Instituto de Ciências Exatas e Aplicadas, Universidade Federal de Ouro Preto, João Monlevade, 2024.
Abstract: O processo florestal de silvicultura tem empregado diversas tecnologias embarcadas em máquinas, porém a gestão dessas informações ainda é fator limitante para o sucesso completo das soluções. Atualmente, a análise das informações geradas a partir dos dados coletados com essas tecnologias, bem como a determinação de anomalias e de suas principais causas continuam sob intervenção manual humana. Na silvicultura, anomalias devem ser detectadas o mais rápido possível para que a ação indevida de campo possa ser interrompida ou que seja tomada ação corretiva imediata. Portanto, o objetivo geral deste trabalho é gerar modelo para classificação automática de anomalias a partir de dados coletados em máquinas de silvicultura. A base utilizada pertence a empresa florestal Celulose Nipo-Brasileira S.A. (CENIBRA). A coleção de dados é formada pelos dados de máquinas de silvicultura, mais especificamente, de controladores de aplicação de insumos sólidos. A coleção de dados é caracterizada como multirrótulo e exigiu tratativas específicas para este tipo de classificação. As etapas passaram por amostragem, definição de variáveis e análise de relacionamentos entre as variáveis, tratamento de dados, sumarização estatística e caracterização dos dados, codificação de variáveis, análise de correlação e avaliação de dimensionalidade, rotulagem de anomalias, balanceamento, validação cruzada e comparação entre experimentos. As técnicas de análise de correlação, PCA e validação cruzada permitiram a obtenção de um modelo com parâmetros satisfatórios de acerto. O melhor resultado para as métricas accuracy, Hamming Loss, F1 score e recall foi por meio do modelo Classifier Chain com classificador XGBoost e hiperparâmetros iterações igual a 100, profundidade igual a 20 e taxa de aprendizado igual a 0.2. A acurácia superior a 72% e o Hamming loss inferior a 5% foram considerados satisfatórios, considerando a complexidade da coleção de dados utilizada.
metadata.dc.description.abstracten: The forestry silviculture process has used several technologies embedded in machines, but the management of this information is still a limiting factor for the complete success of the solutions. Currently, the analysis of information generated from data collected with these technologies, as well as the determination of anomalies and their main causes continue under manual human intervention. In silviculture, anomalies must be detected as quickly as possible so that inappropriate field action can be stopped or immediate corrective action can be taken. Therefore, the general objective of this work is to generate a model for automatic classification of anomalies based on data collected from silviculture machines. The base used belongs to the forestry company Celulose Nipo-Brasileira S.A. - CENIBRA. The data collection is made up of data from silviculture machines, more specifically, from solid input application controllers. The data collection is characterized as multi-label and required specific treatments for this type of classification. The steps included sampling, definition of variables and analysis of relationships between variables, data treatment, statistical summarization and data characterization, coding of variables, correlation analysis and dimensionality assessment, labeling of anomalies, balancing, cross-validation and comparison between experiments. Correlation analysis, PCA and crossvalidation techniques allowed obtaining a model with satisfactory accuracy parameters. The best result for the accuracy, hamming loss, F1 precision and Recall metrics was through the Classifier Chain model with XGBoost classifier and hyperparameters iterations equal to 100, depth equal to 20 and rate learning rate equal to 0.2. The accuracy greater than 72% and the hamming loss less than 5% were considered satisfactory, considering the complexity of the data collection used.
URI: http://www.monografias.ufop.br/handle/35400000/6898
metadata.dc.rights.license: Este trabalho está sob uma licença Creative Commons BY-NC-ND 4.0 (https://creativecommons.org/licenses/by-nc-nd/4.0/?ref=chooser-v1).
Appears in Collections:Especialização - Ciência dos Dados

Files in This Item:
File Description SizeFormat 
MONOGRAFIA_AnáliseAnomaliasOperações.pdf12,84 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.