Um estudo conduzido na China desenvolveu e validou uma das primeiras escalas específicas para medir o letramento em inteligência artificial generativa (GenAI) de professores de inglês como língua estrangeira, oferecendo um instrumento robusto para orientar formação docente, desenho curricular e políticas em um cenário educacional cada vez mais mediado por IA.
O QUE HÁ DE NOVO: Pesquisadores chineses e internacionais criaram e validaram um questionário padronizado para avaliar o letramento em IA generativa de 603 professores universitários de inglês como língua estrangeira em cinco províncias da China. O instrumento, aplicado em duas fases (exploratória e confirmatória), resultou em uma escala de 32 itens distribuídos em cinco dimensões, conhecimento, uso, desenho, avaliação e ética em GenAI, com índices sólidos de confiabilidade e validade psicométrica.
COMO FUNCIONA: O estudo partiu de uma lacuna clara: até agora, a literatura sobre IA na educação de línguas tratava o letramento em IA de forma geral, sem uma medida específica para o contexto de inglês como língua estrangeira. Os autores combinaram uma fase qualitativa, com entrevistas individuais a 15 especialistas em linguística aplicada e IA, e uma fase quantitativa, apoiada em frameworks teóricos como a taxonomia de Bloom, o modelo de letramento em IA de Ng et al. e referências à lógica TPACK para estruturar as dimensões e gerar itens do questionário.
A versão inicial da escala, em inglês, trazia 38 itens em cinco fatores (conhecimento, uso, desenho, avaliação e ética em GenAI), respondidos em uma escala Likert de 1 a 5. Após validação de conteúdo por 10 especialistas, um piloto com 50 docentes e revisões sucessivas, os pesquisadores aplicaram o instrumento a um grupo de 291 professores para Análise Fatorial Exploratória, excluindo respostas com padrões pouco confiáveis. Em seguida, uma amostra independente de 312 docentes respondeu à versão refinada, submetida à Análise Fatorial Confirmatória, testes de ajuste do modelo, confiabilidade composta, validade convergente e discriminante, além de verificações de invariância de medida por gênero, titulação e posição acadêmica.
INSIGHT CENTRAL: O ponto de inflexão conceitual do estudo é tratar o letramento em GenAI de professores de inglês não como uma habilidade única, mas como um conjunto estruturado de competências que vão da compreensão dos fundamentos da IA até a capacidade de desenhar atividades e ferramentas baseadas em IA, avaliá-las criticamente e lidar com dilemas éticos. Ao articular essas dimensões com níveis cognitivos de Bloom (conhecer, compreender, aplicar, avaliar, criar) e com a discussão sobre práticas situadas em educação linguística, a pesquisa desloca a noção de “familiaridade tecnológica” para um letramento complexo, contextual e ligado à identidade profissional docente.
PRINCIPAIS RESULTADOS: A Análise Fatorial Exploratória revelou cinco fatores capazes de explicar cerca de 64% da variância das respostas: GenAI Design, GenAI Use, GenAI Knowledge, GenAI Ethics e GenAI Evaluation. Após a exclusão de itens com baixas cargas fatoriais ou comportamento estatístico problemático, a escala estabilizou em 32 itens. Na etapa confirmatória, os índices de ajuste do modelo (como RMSEA, CFI, TLI e SRMR) ficaram em faixas aceitáveis ou excelentes, e os coeficientes de confiabilidade composta superaram confortavelmente o patamar de 0,7 em todos os fatores, indicando boa consistência interna.
A validade convergente foi sustentada por valores de variância média extraída acima de 0,5, enquanto a validade discriminante foi confirmada, com cada fator explicando mais variância em seus próprios itens do que nas correlações com os demais. Testes de invariância mostraram que a estrutura da escala se manteve estável entre homens e mulheres, entre níveis de titulação (graduação, mestrado e doutorado) e entre diferentes posições acadêmicas, o que sugere que o instrumento mede o mesmo construto de forma consistente em subgrupos relevantes da carreira docente.
POR QUE ISSO IMPORTA PARA A EDUCAÇÃO: Em sala de aula, a nova escala permite que instituições e formadores identifiquem com mais precisão onde os professores de inglês estão em relação ao uso de IA generativa: se dominam apenas noções básicas, se já integram bots a atividades de leitura, escrita e fala, se conseguem avaliar a confiabilidade das respostas de sistemas como ChatGPT ou se ainda têm dificuldades com princípios de ética, privacidade e integridade acadêmica. Esse diagnóstico fino é crucial para desenhar formações que realmente respondam às necessidades de docentes que já utilizam IA para preparar materiais, planejar aulas, dar feedback e avaliar textos.
Para gestores universitários, redes de ensino e formuladores de políticas, dispor de uma medida validada de letramento em GenAI abre caminho para decisões mais baseadas em evidências: desde a definição de cursos e trilhas de desenvolvimento profissional, até a avaliação de investimentos em infraestrutura digital e em apoio técnico-pedagógico. Ao tornar mensurável um construto até então tratado apenas de forma conceitual, o estudo também ajuda a antecipar riscos de desigualdade, por exemplo, entre docentes com alta e baixa familiaridade com IA, e fornece um instrumento para monitorar se programas de formação estão, de fato, reduzindo essas brechas.
SIM, MAS… (limitações e riscos): Os autores reconhecem que o estudo se apoia em amostragem por conveniência, restrita a algumas províncias chinesas e a docentes universitários de inglês, o que limita a generalização imediata para outras regiões, níveis de ensino e contextos de baixa infraestrutura tecnológica. Fatores como tipo de instituição, trajetória prévia com tecnologias digitais e anos de experiência, embora descritos, não foram modelados em profundidade como variáveis mediadoras ou moderadoras do letramento em GenAI.
Além disso, o instrumento baseia-se apenas em auto-relato, o que pode inflar percepções de competência ou mascarar usos problemáticos da IA em práticas avaliativas e de autoria de estudantes. Sem triangulação com observações em sala, análises de materiais produzidos ou entrevistas em profundidade, permanece em aberto até que ponto o letramento declarado se traduz em práticas responsáveis e pedagógica e eticamente sólidas. Há ainda o risco de que sistemas de avaliação institucional passem a usar a escala apenas como indicador de desempenho, e não como ferramenta formativa, pressionando docentes a “marcar respostas certas” sem apoio real para desenvolver as competências avaliadas.
EXEMPLOS NA PRÁTICA EDUCACIONAL: Em uma universidade que adote a escala, um diagnóstico inicial pode revelar, por exemplo, que professores dominam o uso de GenAI para resumir textos e gerar exercícios de gramática, mas se sentem inseguros para avaliar se uma redação foi escrita com apoio indevido de um chatbot ou para discutir com estudantes limites éticos de uso. A partir desse retrato, programas de formação podem concentrar esforços em oficinas sobre desenho de tarefas que minimizem plágio, desenvolvimento de critérios de avaliação alinhados à presença inevitável da IA e construção de estratégias de transparência no uso de ferramentas generativas.
Em redes que planejam incluir IA generativa em currículos de línguas, a escala pode servir como linha de base para mapear onde estão os professores antes de qualquer intervenção e para acompanhar, ao longo de ciclos anuais, se cursos, comunidades de prática e apoio técnico têm impacto real no letramento em GenAI. Em cursos de formação inicial, os cinco fatores da escala podem orientar disciplinas específicas: fundamentos conceituais de IA para professores de línguas, laboratórios de criação de atividades com bots, módulos sobre avaliação mediada por IA e seminários sobre ética, privacidade e autoria em ambientes digitais.
O QUE VEM DEPOIS: A própria pesquisa sugere uma agenda ampla para próximos passos: testar a escala em outros países e em diferentes níveis de ensino, inclusive em escolas básicas, para verificar se a estrutura de cinco dimensões se mantém ou se surgem novos componentes em contextos com menos infraestrutura ou outros marcos regulatórios. Investigações longitudinais podem explorar como o letramento em GenAI evolui ao longo do tempo em resposta a políticas institucionais, mudanças na tecnologia e reformas curriculares, e como essa evolução se articula com a reconstrução identitária de professores em um cenário em que parte de seu trabalho tradicional é automatizado.
NOSSA LEITURA: Ao traduzir um conceito ainda nebuloso em um instrumento mensurável e disciplinarmente situado, o estudo fornece uma peça-chave para que a discussão sobre IA generativa na educação de línguas deixe de ser apenas normativa (“usar ou proibir”) e passe a ser estratégica, baseada em evidências sobre competências reais dos docentes. Para gestores e formuladores de políticas, a mensagem implícita é clara: sem investir de forma estruturada no letramento em GenAI de professores, qualquer aposta em tecnologias generativas na educação de inglês corre o risco de ampliar desigualdades, estimular usos acríticos e minar a integridade acadêmica. A escala não resolve esse problema, mas oferece um ponto de partida concreto para enfrentá-lo.