Um estudo de métodos mistos avaliou como o ChatGPT pode apoiar estudantes universitários de mandarim como língua estrangeira em tarefas padronizadas de escrita semelhantes às do exame AP Chinese Language and Culture. Os resultados mostram aumento consistente nas notas quando a IA foi usada como apoio limitado, sobretudo para vocabulário e tradução de frases,, reforçando o potencial da IA generativa no ensino de línguas, mas também a necessidade de regras claras, formação docente e cuidado com dependência e validade avaliativa.
O QUE HÁ DE NOVO: Pesquisadores de universidades dos Estados Unidos testaram o uso do ChatGPT em um contexto ainda pouco explorado: a escrita em mandarim como segunda língua em tarefas associadas a uma avaliação padronizada de alto impacto. Participaram 26 estudantes universitários de terceiro e quarto ano, com idades entre 20 e 25 anos, que completaram quatro tarefas de escrita em dois dias consecutivos usando questões de resposta livre do AP Chinese Language and Culture Exam de 2021 e 2022. Em apenas uma tarefa por dia, os estudantes puderam consultar o ChatGPT 3.5, versão gratuita disponível à época do estudo.
COMO FUNCIONA: A IA foi tratada como ferramenta de apoio, não como geradora integral da redação. Os participantes podiam fazer perguntas ao ChatGPT em quatro categorias delimitadas: vocabulário, gramática e estrutura, tradução de frases e informações necessárias para elaborar a resposta. No primeiro dia, eles puderam usar a IA na tarefa de narração a partir de imagens, mas não na resposta a e-mail; no segundo dia, a regra foi invertida, permitindo o uso do ChatGPT na resposta a e-mail, mas não na narração. Depois das atividades, os estudantes responderam a um questionário com itens de múltipla escolha, escala Likert e perguntas abertas, além de terem seus registros de interação com a IA analisados.
As produções foram avaliadas por dois corretores experientes em AP Chinese, seguindo critérios do exame: cumprimento da tarefa, apresentação do texto e uso da língua. Cada texto recebeu nota geral e notas por domínio em uma escala de 0 a 6. Para reduzir viés de avaliação, o estudo verificou a concordância entre os avaliadores, considerada robusta pelos indicadores estatísticos reportados, especialmente nas notas gerais e em boa parte dos subdomínios.
PRINCIPAIS RESULTADOS: O uso do ChatGPT foi associado a notas mais altas nas duas tarefas. Na narração, as médias com IA ficaram acima das médias sem IA para os dois avaliadores; na resposta a e-mail, a melhora também apareceu, com destaque para um aumento mais visível nas médias atribuídas por um dos corretores. Na comparação geral entre tarefas com e sem ChatGPT, o ganho médio ficou entre cerca de 0,39 e 0,52 ponto em uma escala de 0 a 6, com diferença estatisticamente significativa. A análise dos registros mostrou que os estudantes recorreram mais à IA para vocabulário, seguido por tradução de frases; perguntas diretas de informação foram raras. Nas respostas abertas, eles descreveram o ChatGPT como útil para encontrar palavras, compreender caracteres por pinyin, estruturar frases e atuar como uma espécie de tutor linguístico, embora alguns tenham relatado preocupação em preservar sua própria voz e evitar uso excessivo.
POR QUE ISSO IMPORTA PARA A EDUCAÇÃO: Para o ensino de línguas, o estudo sugere que a IA generativa pode funcionar como apoio pontual em momentos nos quais estudantes travam por falta de repertório lexical ou por dificuldade de formular estruturas em uma língua distante do inglês e de outras línguas alfabéticas. Isso é particularmente relevante para idiomas menos ensinados em larga escala, como o mandarim em muitos sistemas educacionais, nos quais há menor oferta de materiais, tutores e oportunidades de prática. Para professores, os achados indicam uma possibilidade de integração mais precisa da IA: não como substituta da instrução, mas como ferramenta controlada para prática, revisão e preparação para gêneros específicos de avaliação.
Ao mesmo tempo, a pesquisa toca em uma questão sensível para gestores e formuladores de políticas: como preservar a validade de avaliações de escrita quando estudantes têm acesso a ferramentas capazes de sugerir vocabulário, frases e estruturas completas. O desenho do estudo mostra um caminho intermediário, baseado em permissões explícitas e categorias de uso, mas também evidencia que escolas e universidades precisarão definir quando a IA é parte legítima do processo de aprendizagem e quando compromete a medição da proficiência individual. Sem esse alinhamento, a tecnologia pode ampliar desigualdades entre estudantes que sabem usá-la estrategicamente e aqueles que não receberam orientação.
LIMITES E CUIDADOS: Os resultados devem ser lidos como evidência inicial, não como conclusão definitiva. A amostra foi pequena, composta por 26 universitários em um contexto controlado, e o estudo se concentrou em tarefas específicas do AP Chinese, o que limita a generalização para outros níveis, gêneros textuais, redes públicas ou contextos fora dos Estados Unidos. Também não há dados de longo prazo para saber se o apoio da IA melhora retenção, autonomia e desenvolvimento real da escrita ou se apenas eleva o desempenho em tarefas imediatas. Os próprios participantes apontaram riscos de dependência e de uso excessivo, reforçando a necessidade de letramento em IA, orientação ética e novas pesquisas com grupos mais diversos, diferentes tipos de escrita e acompanhamento prolongado da aprendizagem.
Fonte: Exploring AI-assistance in L2 Chinese writing with standardized assessment tasks