Teoria de resposta ao item - Aplicações e Teste
Dentro do campo de Teoria dos Testes Psicométricos Apareceram diferentes denominações que atualmente levam o nome de "Teoria da Resposta ao Item" (F.M. Lord, 1980). Essa denominação apresenta algumas diferenças em relação ao modelo clássico: 1.- a relação entre o valor esperado dos escores do sujeito e o traço (característica responsável pelos valores), geralmente não é linear. 2.- pretende fazer previsões individuais sem precisar se referir às características do grupo normativo.
Você pode também estar interessado em: Teoria dos testes clássicos Index- Teoria da resposta ao item ou modelos do traço latente na teoria dos testes
- Modelos de teoria da resposta ao item (tri)
- Estimativa de parâmetros
- Construção de teste
- Aplicações da teoria da resposta ao item
- Interpretação de pontuações
Teoria da resposta ao item ou modelos do traço latente na teoria dos testes
Vemos, então, que essa Teoria da Resposta ao item fornece a possibilidade de descrever separadamente os itens e os indivíduos; Considera também que a resposta dada pelo sujeito depende do nível de habilidade que tem no intervalo considerado. A origem desses modelos é devida a Lazarsfeld, 1950, que introduziu o termo "traço latente" .
A partir daqui, considera-se que cada indivíduo possui um parâmetro individual que é responsável pelas características do sujeito, também chamado de "traço". Esse recurso não é diretamente mensurável, portanto, o parâmetro individual é chamado de variável latente. Ao aplicar os testes, você pode obter duas coisas diferentes, a pontuação verdadeira e a escala de adequação; Isto é conseguido se passarmos dois testes com a mesma aptidão para o mesmo grupo.
Na Teoria do Traço Latente ou Teoria da resposta ao item A pontuação verdadeira é o valor esperado da pontuação observada. De acordo com o Senhor, a verdadeira pontuação e aptidão são a mesma coisa, mas expressa em diferentes escalas de medição.
Modelos de teoria da resposta ao item (tri)
Modelos de Erro Binomial: foram introduzidos por Lord (1965), os quais assumem que o escore observado corresponde ao número de acertos obtidos no teste (cujos itens possuem todas as mesmas dificuldades e possuem independência local, ou seja, a probabilidade responder corretamente a um item não é afetado pelas respostas dadas a outros itens).
Modelos de Poisson: estes modelos são apropriados para aqueles testes que possuem um grande número de itens e nos quais a probabilidade de resposta correta ou incorreta é pequena. Dentro deste grupo, por sua vez, temos modelos diferentes:
- Modelo Rasch de Poisson, cujas hipóteses são: cada teste tem um grande número de itens binários que são localmente independentes. a probabilidade de erro em cada item é pequena. A probabilidade de o sujeito cometer um erro depende de duas coisas: a dificuldade do teste e a aptidão do sujeito. a aditividade das dificuldades, entendida como resultado da mistura de dois testes equivalentes em um único teste cuja dificuldade é a soma das dificuldades dos dois testes iniciais.
- Modelo de Poisson para avaliar a velocidade: Este modelo também foi proposto por Rasch e caracteriza-se pelo fato de que a velocidade na execução do teste é levada em consideração. O modelo pode ser posicionado de duas maneiras: contar o número de erros cometidos e palavras lidas em uma unidade de tempo. contar o número de erros cometidos e o tempo gasto na conclusão da leitura do texto. A probabilidade de realização de um certo número de palavras de um teste (i) por um sujeito (j), durante um tempo (t)
- Modelos normais de Ojiva: é um modelo proposto por Lord (1968), que é usado em testes com itens dicotômicos e com apenas uma variável em comum, e seu gráfico seria o seguinte: Os pressupostos básicos que caracterizam este modelo são:
- o espaço da variante latente é unidimensional (k = 1).
- independência local entre os entes.
- a métrica para a variável latente pode ser escolhida de modo que a curva de cada item seja a ogiva normal.
Modelos logísticos; É um modelo muito semelhante ao anterior, mas também tem mais vantagens em relação ao seu tratamento matemático. A função logística assume a seguinte forma: Existem diferentes modelos logísticos dependendo do número de parâmetros que possuem:
- Modelo logístico de 2 parâmetros, Birnbaum 1968, entre as suas características mencionamos que é unidimensional, há independência local, os elementos são dicotômicos, etc.
- Modelo logístico de 3 parâmetros, Senhor, é caracterizado porque a probabilidade de adivinhar corretamente é um fator que influenciará o desempenho do teste. 4.3. Modelo logístico de 4 parâmetros: modelo proposto por McDonald 1967 e Barton-Lord em 1981, cuja finalidade é explicar os casos em que sujeitos que possuem um alto nível de condicionamento físico não respondem corretamente ao item.
- Modelo logístico de Rasch: Este modelo é o que gerou o maior número de trabalhos apesar de ter uma desvantagem, isto é que o seu ajuste aos dados reais é mais difícil, mas em contraste com isso a vantagem que o torna tão usado é que ele não requer grande Tamanhos de amostra para o seu ajuste.
Estimativa de parâmetros
O método que mais tem sido utilizado é a Máxima Verossimilhança, ao lado deste método são utilizados procedimentos de aproximação numérica, como Newton-Raphson e Scoring (Rao). O Método da Máxima Verossimilhança baseia-se no princípio de obter estimadores dos parâmetros desconhecidos que maximizam a probabilidade de obtenção das referidas amostras. Além da Máxima Verossimilhança, também é utilizada a Estimação Bayesiana, baseada no Teorema de Bayes, que consiste em incorporar todas as informações conhecidas, a priori, relevantes para o processo de inferência. Um estudo mais aprofundado do método bayesiano para a estimação de parâmetros de aptidão é o feito por Birnbaum (1996) e Owen (1975). .
FUNÇÕES DE INFORMAÇÃO
O melhor teste que pode ser construído é aquele que fornece mais informações sobre o traço latente. A quantificação desta informação é feita através das "funções de informação". A fórmula da função de informação, Birnbaum 1968, é a seguinte: Deve-se levar em conta que a informação obtida em um teste é a soma das informações de cada item, além da contribuição de cada item não depender do resto dos itens. que compõem o teste. Em termos gerais, podemos dizer que a informação, em todos os modelos:
- varia com os níveis de aptidão.
- Quanto maior a inclinação da curva, mais informações.
- depende da variância das pontuações, quanto maior esta, menor a informação.
Construção de teste
A primeira tarefa e um dos mais importantes no momento da construção de um teste é a escolha dos itens, acorde prévio dos pressupostos teóricos que devem definir a característica que o teste pretende medir. O conceito "análise de itens" refere-se ao conjunto de procedimentos formais que são realizados para selecionar os itens que eventualmente formarão o teste. A informação considerada mais relevante em relação aos itens é:
- Dificuldade do item, porcentagem de indivíduos que o corrigem.
- Discriminação, correlação de cada item com a pontuação total no teste.
- Distratores ou análise de erros, sua influência é relevante, afeta a dificuldade do item e faz com que os valores de discriminação subestimem.
No momento do estabelecimento de indicadores dos diferentes índices, geralmente são utilizados índices ou índices, sendo os mais utilizados os seguintes:
Índice de dificuldade Índice de discriminação Índice de confiabilidade Índice de validade Índices conhecidos que devem ser levados em conta para a seleção dos itens que formarão o teste, veremos quais etapas são necessárias para a construção de um teste:
- Especificação do problema.
- Enunciar um amplo conjunto de itens e depurá-los.
- Escolha do modelo.
- Teste os itens pré-selecionados.
- Selecione os melhores itens.
- Estudar as qualidades do teste
- Estabelecer as normas de interpretação do teste final obtido.
A partir dos pontos anteriores, deve-se notar que a escolha do modelo, ponto 3, dependerá dos objetivos perseguidos pelo teste, das características e qualidade dos dados e dos recursos disponíveis. Quando um modelo é escolhido, dadas as condições teóricas em que ele pode ser aplicado, não apesar de suas virtudes deve ser analisado em cada caso e circunstâncias específicas. As propriedades atribuíveis aos modelos que compõem o Teoria da Resposta ao Item (TRI), pode ser afetado por:
- a dimensionalidade do teste a escassa disponibilidade de amostra falta de recursos do computador Há um número de preferências quando se utiliza um ou outros modelos, vamos vê-los: modelos de ogivas normais não são geralmente utilizados em aplicações, seu valor é teórico.
- Rasch: adequado para comparação horizontal (testes comparáveis em níveis de dificuldade com distribuições de fitness semelhantes). ter diferentes formas do mesmo teste. * 2 e 3 parâmetros: são os que melhor se adaptam a uma variedade de problemas.
- para detectar padrões de resposta errados. para a equalização vertical dos testes (comparar testes com diferentes níveis de dificuldade e diferentes distribuições para fitness).
1 e 2 parâmetros:
- adequado para construir uma única escala, para que você possa comparar as habilidades em diferentes níveis.
A escolha do modelo, além do fim perseguido, pode ser afetada pelo tamanho da amostra; No caso de a amostra ser grande e representativa, não haverá problema nem no modelo clássico nem no traço latente. Mas no TRI ( teoria da resposta ao item ) uma pequena amostra força você a escolher modelos com um pequeno número de parâmetros, até mesmo o modelo uniparâmetro.
Aplicações da teoria da resposta ao item
Vejamos quais são as aplicações mais comuns: a) Equalização de testes, às vezes é necessário relacionar as pontuações obtidas em diferentes testes, com duas finalidades possíveis:
- Equalização horizontal: busca-se obter diferentes formas do mesmo teste.
- Equalização Vertical: o objetivo é construir uma escala única de aptidão com diferentes níveis de dificuldade. Em relação à equalização dos testes, Lord (1980) introduz o conceito de "equidade", o que implica que para cada sujeito dois testes podem ser intercambiáveis, uma vez que se aplica que um ou outro não mudará o nível de aptidão que havia sido estimado. para o assunto.
Estudo do viés dos itens, um item é distorcido quando, em média, dá pontuações significativamente diferentes em grupos específicos que deveriam fazer parte da mesma população.
Testes adaptados ou média , Através do TRI, podem ser construídos testes individualizados que permitem inferir de maneira mais precisa o verdadeiro valor do traço em questão. Os itens serão administrados sequencialmente, a pré-configuração de um item ou outro dependerá das respostas dadas acima. Existem diferentes tipos de testes adaptados, destacamos o seguinte:
- procedimento de dois estágios, Lord 1971; Bertz e Weiss 1973 - 1974. Um teste é passado primeiro e dependendo dos resultados um segundo teste é administrado.
- Procedimento em várias etapas, é o mesmo que o anterior, apenas o processo inclui mais etapas.
- Modelo de ramificação fixa, Lord 1970, 1971, 1974; Mussio 1973. Todos os assuntos resolvem o mesmo item, dependendo da resposta, um conjunto de itens é resolvido.
- Modelo ramificado variável, baseia-se na independência entre os itens e as propriedades dos estimadores de máxima verossimilhança.
Banco de itens, Ter um grande conjunto de itens é algo que melhorará a qualidade do teste, mas para isso os itens devem passar por um processo de depuração primeiro. Para classificar os itens, é necessário levar em consideração qual característica se destina a medir o teste do qual este item fará parte..
Interpretação de pontuações
Escalas: sua finalidade é oferecer um continuum para ordenar, classificar ou saber qual é a magnitude relativa do recurso avaliado; Isso nos permitirá estabelecer diferenças e semelhanças nas pessoas com relação a esse traço. As escalas utilizadas na Psicologia são: nominal, ordinal, intervalo e razão; estas escalas são construídas a partir dos resultados dos testes, resultados chamados "pontuações diretas" .
Tipificar : tipificar um teste é transformar as pontuações diretas em outras que são facilmente interpretáveis, já que a pontuação tipificada revelará a posição do sujeito em relação ao grupo e nos permitirá fazer comparações intra e intersubjetivas. Existem dois tipos de digitação:
- Linear, reter a forma da distribuição e não modificar o tamanho das correlações.
- Não lineares, eles não preservam a distribuição ou o tamanho das correlações .
ESCALA DE APTIDÃO No TRI, a escala que é construída é aquela escala que corresponde aos níveis de aptidão; Esta escala é caracterizada porque as estimativas e referências são feitas diretamente com respeito à aptidão e sua escala. Além disso, essa aptidão que é estimada depende apenas da forma da curva característica dos itens. Dentro das possíveis escalas, indicamos dois:
- Scale, proposto por Woodcock (1978) e é definido pela seguinte fórmula:
- Escala WITS, proposta por Wright (1977), essa escala é uma modificação da anterior e é dada pela seguinte relação: