Teoria de resposta ao item - Aplicações e Teste

Teoria de resposta ao item - Aplicações e Teste / Psicologia experimental

Dentro do campo de Teoria dos Testes Psicométricos Apareceram diferentes denominações que atualmente levam o nome de "Teoria da Resposta ao Item" (F.M. Lord, 1980). Essa denominação apresenta algumas diferenças em relação ao modelo clássico: 1.- a relação entre o valor esperado dos escores do sujeito e o traço (característica responsável pelos valores), geralmente não é linear. 2.- pretende fazer previsões individuais sem precisar se referir às características do grupo normativo.

Você pode também estar interessado em: Teoria dos testes clássicos Index
  1. Teoria da resposta ao item ou modelos do traço latente na teoria dos testes
  2. Modelos de teoria da resposta ao item (tri)
  3. Estimativa de parâmetros
  4. Construção de teste
  5. Aplicações da teoria da resposta ao item
  6. Interpretação de pontuações

Teoria da resposta ao item ou modelos do traço latente na teoria dos testes

Vemos, então, que essa Teoria da Resposta ao item fornece a possibilidade de descrever separadamente os itens e os indivíduos; Considera também que a resposta dada pelo sujeito depende do nível de habilidade que tem no intervalo considerado. A origem desses modelos é devida a Lazarsfeld, 1950, que introduziu o termo "traço latente" .

A partir daqui, considera-se que cada indivíduo possui um parâmetro individual que é responsável pelas características do sujeito, também chamado de "traço". Esse recurso não é diretamente mensurável, portanto, o parâmetro individual é chamado de variável latente. Ao aplicar os testes, você pode obter duas coisas diferentes, a pontuação verdadeira e a escala de adequação; Isto é conseguido se passarmos dois testes com a mesma aptidão para o mesmo grupo.

Na Teoria do Traço Latente ou Teoria da resposta ao item A pontuação verdadeira é o valor esperado da pontuação observada. De acordo com o Senhor, a verdadeira pontuação e aptidão são a mesma coisa, mas expressa em diferentes escalas de medição.

Modelos de teoria da resposta ao item (tri)

Modelos de Erro Binomial: foram introduzidos por Lord (1965), os quais assumem que o escore observado corresponde ao número de acertos obtidos no teste (cujos itens possuem todas as mesmas dificuldades e possuem independência local, ou seja, a probabilidade responder corretamente a um item não é afetado pelas respostas dadas a outros itens).

Modelos de Poisson: estes modelos são apropriados para aqueles testes que possuem um grande número de itens e nos quais a probabilidade de resposta correta ou incorreta é pequena. Dentro deste grupo, por sua vez, temos modelos diferentes:

  1. Modelo Rasch de Poisson, cujas hipóteses são: cada teste tem um grande número de itens binários que são localmente independentes. a probabilidade de erro em cada item é pequena. A probabilidade de o sujeito cometer um erro depende de duas coisas: a dificuldade do teste e a aptidão do sujeito. a aditividade das dificuldades, entendida como resultado da mistura de dois testes equivalentes em um único teste cuja dificuldade é a soma das dificuldades dos dois testes iniciais.
  2. Modelo de Poisson para avaliar a velocidade: Este modelo também foi proposto por Rasch e caracteriza-se pelo fato de que a velocidade na execução do teste é levada em consideração. O modelo pode ser posicionado de duas maneiras: contar o número de erros cometidos e palavras lidas em uma unidade de tempo. contar o número de erros cometidos e o tempo gasto na conclusão da leitura do texto. A probabilidade de realização de um certo número de palavras de um teste (i) por um sujeito (j), durante um tempo (t)
  3. Modelos normais de Ojiva: é um modelo proposto por Lord (1968), que é usado em testes com itens dicotômicos e com apenas uma variável em comum, e seu gráfico seria o seguinte: Os pressupostos básicos que caracterizam este modelo são:
  • o espaço da variante latente é unidimensional (k = 1).
  • independência local entre os entes.
  • a métrica para a variável latente pode ser escolhida de modo que a curva de cada item seja a ogiva normal.

Modelos logísticos; É um modelo muito semelhante ao anterior, mas também tem mais vantagens em relação ao seu tratamento matemático. A função logística assume a seguinte forma: Existem diferentes modelos logísticos dependendo do número de parâmetros que possuem:

  • Modelo logístico de 2 parâmetros, Birnbaum 1968, entre as suas características mencionamos que é unidimensional, há independência local, os elementos são dicotômicos, etc.
  • Modelo logístico de 3 parâmetros, Senhor, é caracterizado porque a probabilidade de adivinhar corretamente é um fator que influenciará o desempenho do teste. 4.3. Modelo logístico de 4 parâmetros: modelo proposto por McDonald 1967 e Barton-Lord em 1981, cuja finalidade é explicar os casos em que sujeitos que possuem um alto nível de condicionamento físico não respondem corretamente ao item.
  • Modelo logístico de Rasch: Este modelo é o que gerou o maior número de trabalhos apesar de ter uma desvantagem, isto é que o seu ajuste aos dados reais é mais difícil, mas em contraste com isso a vantagem que o torna tão usado é que ele não requer grande Tamanhos de amostra para o seu ajuste.

Estimativa de parâmetros

O método que mais tem sido utilizado é a Máxima Verossimilhança, ao lado deste método são utilizados procedimentos de aproximação numérica, como Newton-Raphson e Scoring (Rao). O Método da Máxima Verossimilhança baseia-se no princípio de obter estimadores dos parâmetros desconhecidos que maximizam a probabilidade de obtenção das referidas amostras. Além da Máxima Verossimilhança, também é utilizada a Estimação Bayesiana, baseada no Teorema de Bayes, que consiste em incorporar todas as informações conhecidas, a priori, relevantes para o processo de inferência. Um estudo mais aprofundado do método bayesiano para a estimação de parâmetros de aptidão é o feito por Birnbaum (1996) e Owen (1975). .

FUNÇÕES DE INFORMAÇÃO

O melhor teste que pode ser construído é aquele que fornece mais informações sobre o traço latente. A quantificação desta informação é feita através das "funções de informação". A fórmula da função de informação, Birnbaum 1968, é a seguinte: Deve-se levar em conta que a informação obtida em um teste é a soma das informações de cada item, além da contribuição de cada item não depender do resto dos itens. que compõem o teste. Em termos gerais, podemos dizer que a informação, em todos os modelos:

  • varia com os níveis de aptidão.
  • Quanto maior a inclinação da curva, mais informações.
  • depende da variância das pontuações, quanto maior esta, menor a informação.

Construção de teste

A primeira tarefa e um dos mais importantes no momento da construção de um teste é a escolha dos itens, acorde prévio dos pressupostos teóricos que devem definir a característica que o teste pretende medir. O conceito "análise de itens" refere-se ao conjunto de procedimentos formais que são realizados para selecionar os itens que eventualmente formarão o teste. A informação considerada mais relevante em relação aos itens é:

  1. Dificuldade do item, porcentagem de indivíduos que o corrigem.
  2. Discriminação, correlação de cada item com a pontuação total no teste.
  3. Distratores ou análise de erros, sua influência é relevante, afeta a dificuldade do item e faz com que os valores de discriminação subestimem.

No momento do estabelecimento de indicadores dos diferentes índices, geralmente são utilizados índices ou índices, sendo os mais utilizados os seguintes:

Índice de dificuldade Índice de discriminação Índice de confiabilidade Índice de validade Índices conhecidos que devem ser levados em conta para a seleção dos itens que formarão o teste, veremos quais etapas são necessárias para a construção de um teste:

  1. Especificação do problema.
  2. Enunciar um amplo conjunto de itens e depurá-los.
  3. Escolha do modelo.
  4. Teste os itens pré-selecionados.
  5. Selecione os melhores itens.
  6. Estudar as qualidades do teste
  7. Estabelecer as normas de interpretação do teste final obtido.

A partir dos pontos anteriores, deve-se notar que a escolha do modelo, ponto 3, dependerá dos objetivos perseguidos pelo teste, das características e qualidade dos dados e dos recursos disponíveis. Quando um modelo é escolhido, dadas as condições teóricas em que ele pode ser aplicado, não apesar de suas virtudes deve ser analisado em cada caso e circunstâncias específicas. As propriedades atribuíveis aos modelos que compõem o Teoria da Resposta ao Item (TRI), pode ser afetado por:

  • a dimensionalidade do teste a escassa disponibilidade de amostra falta de recursos do computador Há um número de preferências quando se utiliza um ou outros modelos, vamos vê-los: modelos de ogivas normais não são geralmente utilizados em aplicações, seu valor é teórico.
  • Rasch: adequado para comparação horizontal (testes comparáveis ​​em níveis de dificuldade com distribuições de fitness semelhantes). ter diferentes formas do mesmo teste. * 2 e 3 parâmetros: são os que melhor se adaptam a uma variedade de problemas.
  • para detectar padrões de resposta errados. para a equalização vertical dos testes (comparar testes com diferentes níveis de dificuldade e diferentes distribuições para fitness).

1 e 2 parâmetros:

  • adequado para construir uma única escala, para que você possa comparar as habilidades em diferentes níveis.

A escolha do modelo, além do fim perseguido, pode ser afetada pelo tamanho da amostra; No caso de a amostra ser grande e representativa, não haverá problema nem no modelo clássico nem no traço latente. Mas no TRI ( teoria da resposta ao item ) uma pequena amostra força você a escolher modelos com um pequeno número de parâmetros, até mesmo o modelo uniparâmetro.

Aplicações da teoria da resposta ao item

Vejamos quais são as aplicações mais comuns: a) Equalização de testes, às vezes é necessário relacionar as pontuações obtidas em diferentes testes, com duas finalidades possíveis:

  • Equalização horizontal: busca-se obter diferentes formas do mesmo teste.
  • Equalização Vertical: o objetivo é construir uma escala única de aptidão com diferentes níveis de dificuldade. Em relação à equalização dos testes, Lord (1980) introduz o conceito de "equidade", o que implica que para cada sujeito dois testes podem ser intercambiáveis, uma vez que se aplica que um ou outro não mudará o nível de aptidão que havia sido estimado. para o assunto.

Estudo do viés dos itens, um item é distorcido quando, em média, dá pontuações significativamente diferentes em grupos específicos que deveriam fazer parte da mesma população.

Testes adaptados ou média , Através do TRI, podem ser construídos testes individualizados que permitem inferir de maneira mais precisa o verdadeiro valor do traço em questão. Os itens serão administrados sequencialmente, a pré-configuração de um item ou outro dependerá das respostas dadas acima. Existem diferentes tipos de testes adaptados, destacamos o seguinte:

  • procedimento de dois estágios, Lord 1971; Bertz e Weiss 1973 - 1974. Um teste é passado primeiro e dependendo dos resultados um segundo teste é administrado.
  • Procedimento em várias etapas, é o mesmo que o anterior, apenas o processo inclui mais etapas.
  • Modelo de ramificação fixa, Lord 1970, 1971, 1974; Mussio 1973. Todos os assuntos resolvem o mesmo item, dependendo da resposta, um conjunto de itens é resolvido.
  • Modelo ramificado variável, baseia-se na independência entre os itens e as propriedades dos estimadores de máxima verossimilhança.

Banco de itens, Ter um grande conjunto de itens é algo que melhorará a qualidade do teste, mas para isso os itens devem passar por um processo de depuração primeiro. Para classificar os itens, é necessário levar em consideração qual característica se destina a medir o teste do qual este item fará parte..

Interpretação de pontuações

Escalas: sua finalidade é oferecer um continuum para ordenar, classificar ou saber qual é a magnitude relativa do recurso avaliado; Isso nos permitirá estabelecer diferenças e semelhanças nas pessoas com relação a esse traço. As escalas utilizadas na Psicologia são: nominal, ordinal, intervalo e razão; estas escalas são construídas a partir dos resultados dos testes, resultados chamados "pontuações diretas" .

Tipificar : tipificar um teste é transformar as pontuações diretas em outras que são facilmente interpretáveis, já que a pontuação tipificada revelará a posição do sujeito em relação ao grupo e nos permitirá fazer comparações intra e intersubjetivas. Existem dois tipos de digitação:

  1. Linear, reter a forma da distribuição e não modificar o tamanho das correlações.
  2. Não lineares, eles não preservam a distribuição ou o tamanho das correlações .

ESCALA DE APTIDÃO No TRI, a escala que é construída é aquela escala que corresponde aos níveis de aptidão; Esta escala é caracterizada porque as estimativas e referências são feitas diretamente com respeito à aptidão e sua escala. Além disso, essa aptidão que é estimada depende apenas da forma da curva característica dos itens. Dentro das possíveis escalas, indicamos dois:

  1. Scale, proposto por Woodcock (1978) e é definido pela seguinte fórmula:
  2. Escala WITS, proposta por Wright (1977), essa escala é uma modificação da anterior e é dada pela seguinte relação: