Please use this identifier to cite or link to this item: http://www.monografias.ufop.br/handle/35400000/4414
Title: Análise de caracterização quantitativa e predição da evasão escolar nos cursos da área de computação do ICEA por meio de técnicas de Data Science.
Authors: Rodrigues, Edgar Henrique Alves
metadata.dc.contributor.advisor: Sousa, Alexandre Magno de
metadata.dc.contributor.referee: Sousa, Alexandre Magno de
Oliveira, Fernando Bernardes de
Torres, Luiz Carlos Bambirra
Keywords: Aprendizado de computador
Mineração de dados - computação
Análise descritiva
Análise preditiva
Evasão escolar
Issue Date: 2022
Citation: RODRIGUES, Edgar Henrique Alves. Análise de caracterização quantitativa e predição da evasão escolar nos cursos da área de computação do ICEA por meio de técnicas de Data Science. 2022. 71 f. Monografia (Graduação em Engenharia de Computação) - Instituto de Ciências Exatas e Aplicadas, Universidade Federal de Ouro Preto, João Monlevade, 2022.
Abstract: A carência de profissionais de áreas relacionadas à Computação é presenciada globalmente, situação que tende a se agravar visto que a demanda de profissionais no setor é crescente e pode intensificar o cenário. Um dos grandes motivos dessa carência de profissionais são as altas taxas de evasão de alunos em cursos relacionados à Tecnologia de Informação. No ICEA, por exemplo, a taxa de evasão é de 69,21%. Dessa forma, aumentar a retenção de estudantes é uma necessidade eminente. Para isso, neste trabalho são investigados modelos de classificação preditivos que auxiliam na identificação de alunos que são propensos à evadir do curso. Foram obtidos dados dos alunos de Engenharia de Computação e Sistemas de Informação da UFOP, dados os quais foram tratados, analisados e caracterizados a fim de revelar o comportamento dos alunos e identificar as principais variáveis que impactam a evasão. Durante o processo de caracterização dos dados, foram realizadas análises de correlação, de componentes principais e de regressão linear múltipla para definir as variáveis que melhor se ajustavam para treinamento e teste dos modelos. Em seguida, foram construídos e validados modelos preditivos por meio de técnicas de aprendizado de máquina como Regressão Logística, XGBoost, SVM, Árvores de Decisão e Random Forest. Por fim, foi realizada a etapa de análise preditiva, onde foram aplicados experimentos com diferentes configurações de treino e teste. Os modelos alcançaram resultados satisfatórios, alcançando mais de 95% de acurácia na predição da evasão de discentes em determinados cenários. Dessa forma, o trabalho permite melhor entendimento acerca dos fatores que impactam a evasão no ICEA para os cursos de computação. Além disso, abrem-se oportunidades de investigação da evasão em cursos de outras áreas de conhecimento ou em modelos generalizados, o que pode permitir uma comparação e avaliação de qual nível de generalização é oportuno para o ajuste dos modelos.
metadata.dc.description.abstracten: The shortage of professionals in areas related to Technology is witnessed globally, a situation that tends to worsen as the demand for professionals in the sector is growing and may intensify the scenario. One of the main reasons for this lack of professionals is the high dropout rates of students in courses related to Information Technology, which is 69.21% at ICEA. Thus, increasing student retention is an eminent need. For this, we developed predictive models that help in the identification of students who are likely to drop out of the course. We obtained data from students of Computer Engineering and Information Systems at UFOP, data which were processed, analyzed and characterized in order to reveal student behavior and identify variables associated with dropout. During the data characterization process, we performed correlation, principal components and multiple linear regression analyzes to define the indicators that best fit for the following steps. Then, predictive models were built and validated using machine learning techniques such as Logistic Regression, XGBoost, SVM, Decision Trees and Random Forest. Lastly, we performed the predictive analysis step, where experiments with different training and test configurations were applied. The models achieved satisfactory results, reaching more than 95% accuracy in predicting student dropout in certain scenarios. Thus, this work allows a better understanding of dropout at ICEA, revealing factors that impacted data variance and student decision. In addition, opportunities to investigate dropout in courses from other areas of knowledge or using generalized models are opened up, allowing the comparison and assessment of which level of generalization is appropriate for the adjustment of the models.
URI: http://www.monografias.ufop.br/handle/35400000/4414
Appears in Collections:Engenharia de Computação - JMV

Files in This Item:
File Description SizeFormat 
MONOGRAFIA_AnaliseCaracterizacaoQuantitativa.pdf1,87 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons