Use este identificador para citar ou linkar para este item: http://www.monografias.ufop.br/handle/35400000/4414
Título: Análise de caracterização quantitativa e predição da evasão escolar nos cursos da área de computação do ICEA por meio de técnicas de Data Science.
Autor(es): Rodrigues, Edgar Henrique Alves
Orientador(es): Sousa, Alexandre Magno de
Membros da banca: Sousa, Alexandre Magno de
Oliveira, Fernando Bernardes de
Torres, Luiz Carlos Bambirra
Palavras-chave: Aprendizado de computador
Mineração de dados - computação
Análise descritiva
Análise preditiva
Evasão escolar
Data do documento: 2022
Referência: RODRIGUES, Edgar Henrique Alves. Análise de caracterização quantitativa e predição da evasão escolar nos cursos da área de computação do ICEA por meio de técnicas de Data Science. 2022. 71 f. Monografia (Graduação em Engenharia de Computação) - Instituto de Ciências Exatas e Aplicadas, Universidade Federal de Ouro Preto, João Monlevade, 2022.
Resumo: A carência de profissionais de áreas relacionadas à Computação é presenciada globalmente, situação que tende a se agravar visto que a demanda de profissionais no setor é crescente e pode intensificar o cenário. Um dos grandes motivos dessa carência de profissionais são as altas taxas de evasão de alunos em cursos relacionados à Tecnologia de Informação. No ICEA, por exemplo, a taxa de evasão é de 69,21%. Dessa forma, aumentar a retenção de estudantes é uma necessidade eminente. Para isso, neste trabalho são investigados modelos de classificação preditivos que auxiliam na identificação de alunos que são propensos à evadir do curso. Foram obtidos dados dos alunos de Engenharia de Computação e Sistemas de Informação da UFOP, dados os quais foram tratados, analisados e caracterizados a fim de revelar o comportamento dos alunos e identificar as principais variáveis que impactam a evasão. Durante o processo de caracterização dos dados, foram realizadas análises de correlação, de componentes principais e de regressão linear múltipla para definir as variáveis que melhor se ajustavam para treinamento e teste dos modelos. Em seguida, foram construídos e validados modelos preditivos por meio de técnicas de aprendizado de máquina como Regressão Logística, XGBoost, SVM, Árvores de Decisão e Random Forest. Por fim, foi realizada a etapa de análise preditiva, onde foram aplicados experimentos com diferentes configurações de treino e teste. Os modelos alcançaram resultados satisfatórios, alcançando mais de 95% de acurácia na predição da evasão de discentes em determinados cenários. Dessa forma, o trabalho permite melhor entendimento acerca dos fatores que impactam a evasão no ICEA para os cursos de computação. Além disso, abrem-se oportunidades de investigação da evasão em cursos de outras áreas de conhecimento ou em modelos generalizados, o que pode permitir uma comparação e avaliação de qual nível de generalização é oportuno para o ajuste dos modelos.
Resumo em outra língua: The shortage of professionals in areas related to Technology is witnessed globally, a situation that tends to worsen as the demand for professionals in the sector is growing and may intensify the scenario. One of the main reasons for this lack of professionals is the high dropout rates of students in courses related to Information Technology, which is 69.21% at ICEA. Thus, increasing student retention is an eminent need. For this, we developed predictive models that help in the identification of students who are likely to drop out of the course. We obtained data from students of Computer Engineering and Information Systems at UFOP, data which were processed, analyzed and characterized in order to reveal student behavior and identify variables associated with dropout. During the data characterization process, we performed correlation, principal components and multiple linear regression analyzes to define the indicators that best fit for the following steps. Then, predictive models were built and validated using machine learning techniques such as Logistic Regression, XGBoost, SVM, Decision Trees and Random Forest. Lastly, we performed the predictive analysis step, where experiments with different training and test configurations were applied. The models achieved satisfactory results, reaching more than 95% accuracy in predicting student dropout in certain scenarios. Thus, this work allows a better understanding of dropout at ICEA, revealing factors that impacted data variance and student decision. In addition, opportunities to investigate dropout in courses from other areas of knowledge or using generalized models are opened up, allowing the comparison and assessment of which level of generalization is appropriate for the adjustment of the models.
URI: http://www.monografias.ufop.br/handle/35400000/4414
Aparece nas coleções:Engenharia de Computação - JMV

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
MONOGRAFIA_AnaliseCaracterizacaoQuantitativa.pdf1,87 MBAdobe PDFVisualizar/Abrir


Este item está licenciado sob uma Licença Creative Commons Creative Commons