China valida escala para medir letramento em IA generativa de professores de inglês

Um estudo conduzido na China desenvolveu e validou uma das primeiras escalas específicas para medir o letramento em inteligência artificial generativa (GenAI) de professores de inglês como língua estrangeira, oferecendo um instrumento robusto para orientar formação docente, desenho curricular e políticas em um cenário educacional cada vez mais mediado por IA.

O QUE HÁ DE NOVO: Pesquisadores chineses e internacionais criaram e validaram um questionário padronizado para avaliar o letramento em IA generativa de 603 professores universitários de inglês como língua estrangeira em cinco províncias da China. O instrumento, aplicado em duas fases (exploratória e confirmatória), resultou em uma escala de 32 itens distribuídos em cinco dimensões, conhecimento, uso, desenho, avaliação e ética em GenAI, com índices sólidos de confiabilidade e validade psicométrica.

COMO FUNCIONA: O estudo partiu de uma lacuna clara: até agora, a literatura sobre IA na educação de línguas tratava o letramento em IA de forma geral, sem uma medida específica para o contexto de inglês como língua estrangeira. Os autores combinaram uma fase qualitativa, com entrevistas individuais a 15 especialistas em linguística aplicada e IA, e uma fase quantitativa, apoiada em frameworks teóricos como a taxonomia de Bloom, o modelo de letramento em IA de Ng et al. e referências à lógica TPACK para estruturar as dimensões e gerar itens do questionário.

A versão inicial da escala, em inglês, trazia 38 itens em cinco fatores (conhecimento, uso, desenho, avaliação e ética em GenAI), respondidos em uma escala Likert de 1 a 5. Após validação de conteúdo por 10 especialistas, um piloto com 50 docentes e revisões sucessivas, os pesquisadores aplicaram o instrumento a um grupo de 291 professores para Análise Fatorial Exploratória, excluindo respostas com padrões pouco confiáveis. Em seguida, uma amostra independente de 312 docentes respondeu à versão refinada, submetida à Análise Fatorial Confirmatória, testes de ajuste do modelo, confiabilidade composta, validade convergente e discriminante, além de verificações de invariância de medida por gênero, titulação e posição acadêmica.

INSIGHT CENTRAL: O ponto de inflexão conceitual do estudo é tratar o letramento em GenAI de professores de inglês não como uma habilidade única, mas como um conjunto estruturado de competências que vão da compreensão dos fundamentos da IA até a capacidade de desenhar atividades e ferramentas baseadas em IA, avaliá-las criticamente e lidar com dilemas éticos. Ao articular essas dimensões com níveis cognitivos de Bloom (conhecer, compreender, aplicar, avaliar, criar) e com a discussão sobre práticas situadas em educação linguística, a pesquisa desloca a noção de “familiaridade tecnológica” para um letramento complexo, contextual e ligado à identidade profissional docente.

PRINCIPAIS RESULTADOS: A Análise Fatorial Exploratória revelou cinco fatores capazes de explicar cerca de 64% da variância das respostas: GenAI Design, GenAI Use, GenAI Knowledge, GenAI Ethics e GenAI Evaluation. Após a exclusão de itens com baixas cargas fatoriais ou comportamento estatístico problemático, a escala estabilizou em 32 itens. Na etapa confirmatória, os índices de ajuste do modelo (como RMSEA, CFI, TLI e SRMR) ficaram em faixas aceitáveis ou excelentes, e os coeficientes de confiabilidade composta superaram confortavelmente o patamar de 0,7 em todos os fatores, indicando boa consistência interna.

A validade convergente foi sustentada por valores de variância média extraída acima de 0,5, enquanto a validade discriminante foi confirmada, com cada fator explicando mais variância em seus próprios itens do que nas correlações com os demais. Testes de invariância mostraram que a estrutura da escala se manteve estável entre homens e mulheres, entre níveis de titulação (graduação, mestrado e doutorado) e entre diferentes posições acadêmicas, o que sugere que o instrumento mede o mesmo construto de forma consistente em subgrupos relevantes da carreira docente.

POR QUE ISSO IMPORTA PARA A EDUCAÇÃO: Em sala de aula, a nova escala permite que instituições e formadores identifiquem com mais precisão onde os professores de inglês estão em relação ao uso de IA generativa: se dominam apenas noções básicas, se já integram bots a atividades de leitura, escrita e fala, se conseguem avaliar a confiabilidade das respostas de sistemas como ChatGPT ou se ainda têm dificuldades com princípios de ética, privacidade e integridade acadêmica. Esse diagnóstico fino é crucial para desenhar formações que realmente respondam às necessidades de docentes que já utilizam IA para preparar materiais, planejar aulas, dar feedback e avaliar textos.

Para gestores universitários, redes de ensino e formuladores de políticas, dispor de uma medida validada de letramento em GenAI abre caminho para decisões mais baseadas em evidências: desde a definição de cursos e trilhas de desenvolvimento profissional, até a avaliação de investimentos em infraestrutura digital e em apoio técnico-pedagógico. Ao tornar mensurável um construto até então tratado apenas de forma conceitual, o estudo também ajuda a antecipar riscos de desigualdade, por exemplo, entre docentes com alta e baixa familiaridade com IA, e fornece um instrumento para monitorar se programas de formação estão, de fato, reduzindo essas brechas.

SIM, MAS… (limitações e riscos): Os autores reconhecem que o estudo se apoia em amostragem por conveniência, restrita a algumas províncias chinesas e a docentes universitários de inglês, o que limita a generalização imediata para outras regiões, níveis de ensino e contextos de baixa infraestrutura tecnológica. Fatores como tipo de instituição, trajetória prévia com tecnologias digitais e anos de experiência, embora descritos, não foram modelados em profundidade como variáveis mediadoras ou moderadoras do letramento em GenAI.

Além disso, o instrumento baseia-se apenas em auto-relato, o que pode inflar percepções de competência ou mascarar usos problemáticos da IA em práticas avaliativas e de autoria de estudantes. Sem triangulação com observações em sala, análises de materiais produzidos ou entrevistas em profundidade, permanece em aberto até que ponto o letramento declarado se traduz em práticas responsáveis e pedagógica e eticamente sólidas. Há ainda o risco de que sistemas de avaliação institucional passem a usar a escala apenas como indicador de desempenho, e não como ferramenta formativa, pressionando docentes a “marcar respostas certas” sem apoio real para desenvolver as competências avaliadas.

EXEMPLOS NA PRÁTICA EDUCACIONAL: Em uma universidade que adote a escala, um diagnóstico inicial pode revelar, por exemplo, que professores dominam o uso de GenAI para resumir textos e gerar exercícios de gramática, mas se sentem inseguros para avaliar se uma redação foi escrita com apoio indevido de um chatbot ou para discutir com estudantes limites éticos de uso. A partir desse retrato, programas de formação podem concentrar esforços em oficinas sobre desenho de tarefas que minimizem plágio, desenvolvimento de critérios de avaliação alinhados à presença inevitável da IA e construção de estratégias de transparência no uso de ferramentas generativas.

Em redes que planejam incluir IA generativa em currículos de línguas, a escala pode servir como linha de base para mapear onde estão os professores antes de qualquer intervenção e para acompanhar, ao longo de ciclos anuais, se cursos, comunidades de prática e apoio técnico têm impacto real no letramento em GenAI. Em cursos de formação inicial, os cinco fatores da escala podem orientar disciplinas específicas: fundamentos conceituais de IA para professores de línguas, laboratórios de criação de atividades com bots, módulos sobre avaliação mediada por IA e seminários sobre ética, privacidade e autoria em ambientes digitais.

O QUE VEM DEPOIS: A própria pesquisa sugere uma agenda ampla para próximos passos: testar a escala em outros países e em diferentes níveis de ensino, inclusive em escolas básicas, para verificar se a estrutura de cinco dimensões se mantém ou se surgem novos componentes em contextos com menos infraestrutura ou outros marcos regulatórios. Investigações longitudinais podem explorar como o letramento em GenAI evolui ao longo do tempo em resposta a políticas institucionais, mudanças na tecnologia e reformas curriculares, e como essa evolução se articula com a reconstrução identitária de professores em um cenário em que parte de seu trabalho tradicional é automatizado.

NOSSA LEITURA: Ao traduzir um conceito ainda nebuloso em um instrumento mensurável e disciplinarmente situado, o estudo fornece uma peça-chave para que a discussão sobre IA generativa na educação de línguas deixe de ser apenas normativa (“usar ou proibir”) e passe a ser estratégica, baseada em evidências sobre competências reais dos docentes. Para gestores e formuladores de políticas, a mensagem implícita é clara: sem investir de forma estruturada no letramento em GenAI de professores, qualquer aposta em tecnologias generativas na educação de inglês corre o risco de ampliar desigualdades, estimular usos acríticos e minar a integridade acadêmica. A escala não resolve esse problema, mas oferece um ponto de partida concreto para enfrentá-lo.

Fonte(s): EFL teachers’ generative artificial intelligence (GenAI) literacy: A scale development and validation study

Posts Relacionados

Professores de matemática no Japão redesenham aulas diante da IA generativa

Estudantes de licenciatura já usam IA, mas cobram debate curricular

Revisão mapeia como ensinar prompt engineering no currículo universitário