Uso de um método preditivo para inferir a zona de aprendizagem de alunos de programação em um ambiente de correção automática de código

Pereira, Filipe Dwan

Uso de um método preditivo para inferir a zona de aprendizagem de alunos de programação em um ambiente de correção automática de código

dc.contributor.advisor-co1	Oliveira, David Braga Fernandes de
dc.contributor.advisor1	Oliveira, Elaine Harada Teixeira de
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/6553721651836761	por
dc.contributor.referee1	Cristo, Marco Antonio Pinheiro de
dc.contributor.referee2	Isotani, Seiji
dc.creator	Pereira, Filipe Dwan
dc.creator.Lattes	http://lattes.cnpq.br/1043535741108408	por
dc.date.issued	2018-03-29
dc.description.abstract	CS1 (first year programming) classes are known to have a high dropout and non-pass rate. Thus, there have been many studies attempting to predict and alleviate CS1 student performance. Knowing about student performance in advance can be useful for many reasons. For example, teachers can apply specific actions to help learners who are struggling, as well as provide more challenging activities to high-achievers. Initial studies used static factors, such as: high school grades, age, gender. However, student behavior is dynamic and, as such, a data-driven approach has been gaining more attention, since many universities are using web-based environments to support CS1 classes. Thereby, many researchers have started extracting student behavior by cleaning data collected from these environments and using them as features in machine learning (ML) models. Recently, the research community has proposed many predictive methods available, even though many of these studies would need to be replicated, to check if they are context-sensitive. Thus, we have collected a set of successful features correlated with the student grade used in related studies, compiling the best ML attributes, as well as adding new features, and applying them on a database representing 486 CS1 students. The set of features was used in ML pipelines which were optimized with two approaches: hyperparameter-tuning with random search and genetic programming. As a result, we achieved an accuracy of 74.44%, using data from the first two weeks to predict student final grade, which outperforms a state-of-the-art research applied to the same dataset. It is also worth noting that from the eighth week of class, the method achieved accuracy between 85% and 90.62%.	eng
dc.description.resumo	Em média, um terço dos alunos no mundo reprova em disciplinas de introdução à programação de computadores (IPC). Assim, muitos estudos vêm sendo conduzidos a fim de inferir o desempenho de estudantes de turmas de IPC. Inicialmente, pesquisadores investigavam a relação das notas dos alunos com fatores estáticos como: notas no ensino médio, gênero, idade e outros. Entretanto, o comportamento dos estudantes é dinâmico e, dessa forma, abordagens orientadas aos dados vêm ganhando atenção, uma vez que muitas universidades utilizam ambientes web para turmas de programação como juízes online. Com efeito, muitos pesquisadores vêm extraindo e tratando os dados dos estudantes a partir desses ambientes e usando-os como atributos de algoritmos de aprendizagem de máquina para a construção de modelos preditivos. No entanto, a comunidade científica sugere que tais estudos sejam reproduzidos a fim de investigar se eles são generalizáveis a outras bases de dados educacionais. Neste sentido, neste trabalho apresentou-se um método que emprega um conjunto de atributos correlacionados com as notas dos estudantes, sendo alguns baseados em trabalhos relacionados e outros propostos nesta pesquisa, a fim de realizar a predição do desempenho dos alunos nas avaliações intermediárias e nas médias finais. Tal método foi aplicado a uma base de dados com 486 alunos de IPC. O conjunto de atributos chamado de perfil de programação foi empregado em algoritmos de aprendizagem de máquina e otimizado utilizando duas abordagens: a) ajuste de hiperparâmetros com random search e b) construção do pipeline de aprendizagem de máquina utilizando algoritmos evolutivos. Como resultado, atingiu-se 74,44% de acurácia na tarefa de identificar se os alunos iriam ser reprovados ou aprovados usando os dados das duas semanas de aula em uma base de dados balanceada. Esse resultado foi estatisticamente superior ao baseline. Destaca-se ainda que a partir da oitava semana de aula, o método atingiu acurácias entre 85% e 90,62%.	por
dc.format	application/pdf	*
dc.identifier.citation	PEREIRA, Filipe Dwan. Uso de um método preditivo para inferir a zona de aprendizagem de alunos de programação em um ambiente de correção automática de código. 2018. 118 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2018.	por
dc.identifier.uri	https://tede.ufam.edu.br/handle/tede/6425
dc.language	por	por
dc.publisher	Universidade Federal do Amazonas	por
dc.publisher.country	Brasil	por
dc.publisher.department	Instituto de Computação	por
dc.publisher.initials	UFAM	por
dc.publisher.program	Programa de Pós-graduação em Informática	por
dc.rights	Acesso Aberto	por
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject	Alunos de programação	por
dc.subject	Aaprendizagem de máquina	por
dc.subject	Learning analytics	eng
dc.subject	Data-driven - Métricas de software	por
dc.subject	Juízes online	por
dc.subject	Programming students	eng
dc.subject	Machine learning	eng
dc.subject	Learning analytics	eng
dc.subject	Genetic programming	eng
dc.subject.cnpq	CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO	por
dc.thumbnail.url	https://tede.ufam.edu.br//retrieve/22111/Filipe%20Dwan.pdf.jpg	*
dc.title	Uso de um método preditivo para inferir a zona de aprendizagem de alunos de programação em um ambiente de correção automática de código	por
dc.type	Dissertação	por

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1

Nome:: Filipe Dwan.pdf
Tamanho:: 3.45 MB
Formato:: Adobe Portable Document Format
Descrição:

Baixar

Licença do pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 2.32 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

Mestrado em Informática