Estudo testa GenAI no ensino de programação e aponta ganhos e riscos

Um quase experimento com universitários na China comparou o estudo autônomo de programação com e sem apoio de IA generativa e encontrou um quadro misto: melhora no desempenho durante a prática e avanço em autoeficácia, mas sem ganho em transferência de conhecimento quando a ajuda externa é retirada. Ao rastrear cliques, teclado e padrões de interação com o chatbot, o estudo sugere que o diferencial não é “usar ou não usar” GenAI, e sim como os estudantes questionam, avaliam e aplicam o que a ferramenta produz.

O QUE HÁ DE NOVO: Pesquisadores conduziram um quase experimento com 55 alunos de graduação (licenciatura em Física) em uma universidade pública chinesa para medir efeitos da IA generativa no aprendizado de programação, na autoeficácia e nos processos de estudo. O grupo experimental (27) usou exclusivamente um chatbot baseado em GPT‑3.5 durante 120 minutos de autoestudo com tarefas em Python (biblioteca Turtle), enquanto o controle (28) recorreu a outros recursos da internet; depois, ambos fizeram duas tarefas mais complexas em 40 minutos sem acesso a recursos externos. Além de avaliar os programas produzidos, o estudo registrou a trajetória de ações no computador e aplicou questionários antes e depois da intervenção.

COMO FUNCIONA: A intervenção combinou um roteiro de tarefas (entender a biblioteca, produzir um mapa mental e resolver cinco exercícios) com regras distintas de apoio: no experimental, a busca de ajuda acontecia via plataforma de chat com login e interface simplificada; no controle, os estudantes podiam navegar por fontes online alternativas. Os produtos foram avaliados por dois avaliadores em uma rubrica de seis critérios, separando “conceitos” (sintaxe, lógica e completude) de “práticas” (estrutura, estilo e desenho de algoritmo) em escala de 0 a 4. Para entender o processo, um script registrou capturas de tela e eventos de teclado/mouse, que foram codificados em categorias como codificação independente, copiar/colar, revisão, depuração e recuperação/visualização de informação; no grupo com GenAI, a codificação detalhou ainda tipos de comandos e perguntas ao chatbot, expansões e feedback. Em seguida, os autores aplicaram mineração de processos para modelar sequências de ações e usaram padronização via HMM e clusterização (Ward) para separar perfis de estudantes.

PRINCIPAIS RESULTADOS: Durante a fase de prática, o grupo com GenAI teve desempenho superior (mediana 22,30 vs. 18,75; diferença estatisticamente significativa), com destaque para melhorias em desenho de algoritmo, estrutura e estilo de código. Porém, no pós-teste sem recursos externos, não houve diferença significativa no desempenho total entre os grupos; em dimensões específicas, o experimental manteve vantagem apenas em estilo, enquanto apresentou pior lógica e completude de funcionalidade do que o controle. No campo socioemocional, os estudantes com GenAI relataram ganhos significativos em autoeficácia nas dimensões de autorregulação e tarefas complexas, sem diferença prévia entre grupos. No nível comportamental, a GenAI aumentou a frequência de recuperação de informação e de copiar/colar, enquanto o controle exibiu mais codificação independente e mais revisão de conteúdo; os modelos de processo indicaram que o fluxo do experimental orbitou o consumo de conteúdo do chatbot e a cópia seguida de execução/depuração, ao passo que o controle partiu mais frequentemente de reflexão e tentativa própria antes de recorrer a recursos.

INSIGHT CENTRAL: O estudo sugere um mecanismo explicativo para a tensão entre “melhorar a tarefa” e “não melhorar a aprendizagem duradoura”: a IA generativa favorece o que os autores chamam de terceirização cognitiva, reduzindo o esforço necessário para chegar a uma solução funcional no momento, mas podendo atrapalhar a internalização que sustenta a transferência de conhecimento. A diferença entre estudantes de melhor e pior desempenho dentro do próprio grupo com GenAI apareceu na agência epistêmica: os que tiveram melhores resultados tendiam a interagir com o chatbot de forma investigativa (perguntas sucessivas, reformulações, expansão e feedback) e a aplicar o conteúdo seletivamente; os de pior desempenho copiavam mais diretamente o que a IA gerava.

POR QUE ISSO IMPORTA PARA A EDUCAÇÃO: Para cursos de programação, especialmente introdutórios, onde taxas de reprovação e evasão são historicamente altas, o trabalho aponta que GenAI pode acelerar a fase de prática e melhorar a confiança do estudante para enfrentar tarefas mais complexas, o que é relevante para engajamento e persistência. Ao mesmo tempo, os resultados indicam um risco pedagógico claro: se o desenho didático não criar momentos de resolução “sem muletas” e de reflexão sobre o raciocínio, o ganho pode ficar restrito à qualidade imediata do código (estilo, organização, eficiência) sem consolidar competências centrais como lógica e completude quando a ferramenta não está disponível. Para docentes e gestores, a evidência reforça a necessidade de orientar o uso equilibrado, não apenas permitir o acesso,, com atividades que exijam explicitação de decisões, justificativas e comparação crítica entre soluções humanas e sugeridas pela IA, além de diretrizes institucionais para evitar dependência e preservar habilidades de resolução de problemas em avaliações.

SIM, MAS…: O estudo tem limitações importantes para decisões de adoção em larga escala: trata-se de uma amostra relativamente pequena (55 estudantes) e de curta duração, em um contexto específico (licenciatura em Física na China) e com uma biblioteca e linguagem particulares. Além disso, o ambiente de “uso exclusivo de GenAI” no grupo experimental e “internet geral” no controle ajuda a isolar o efeito de um tipo de suporte, mas não representa necessariamente práticas reais híbridas em sala de aula (onde estudantes combinam múltiplas fontes). Ainda assim, a combinação de rubrica de avaliação, rastreamento de comportamento e mineração de processos oferece pistas úteis sobre como padrões de interação podem ampliar benefícios, ou agravar a terceirização cognitiva, quando GenAI entra na rotina de aprender a programar.

O QUE VEM DEPOIS: Como próximos passos, o próprio trabalho indica a necessidade de replicar o desenho em diferentes culturas, cursos e horizontes de tempo para medir efeitos de longo prazo e generalização, além de investigar estratégias de integração didática (por exemplo, GenAI como “companheiro de aprendizagem” versus “assistente de ensino”). Na prática, a agenda que se desenha é menos sobre escolher entre “proibir” ou “liberar” e mais sobre construir intervenções que aumentem agência epistêmica, com roteiros de perguntas, exigência de checagem e justificativa, e alternância planejada entre estudo com e sem suporte, para que a colaboração humano‑IA resulte em aprendizagem transferível, não apenas em entregas mais polidas.

Fonte: Generative artificial intelligence-supported programmingeducation: Effects on learning performance, self-efficacy and processes

Posts Relacionados

Estudo liga atitude com IA à alfabetização e interesse por carreiras no ensino médio

Revisão aponta que chatbots de IA ainda pouco fortalecem identidade científica

Estudo combina 7E, contextos reais e IA e melhora química no ensino médio