Teoria Clássica do Teste

Teoria Clássica do Teste / Psicologia experimental

Um teste é um instrumento científico na medida em que ele mede o que pretende, isto é, é válido e mede bem, isto é, é preciso ou confiável. Se encontrarmos um instrumento do qual não podemos confiar nas medidas que eles fornecem, uma vez que eles variam de tempos em tempos quando medimos o mesmo objeto, então diremos que não é confiável. Um instrumento, para medir propriamente alguma coisa precisa ser precisa, porque, do contrário, meça o que você mede, meça errado. Portanto, ser preciso é uma condição necessária, mas não suficiente. Além disso, deve ser válido, ou seja, o que mede com precisão será o que se pretende medir e nada mais.

Você também pode estar interessado: Teoria da Resposta ao Item - Aplicações e Teste

Confiabilidade:

Confiabilidade absoluta e relativa: Podemos abordar o problema da confiabilidade de um teste de duas maneiras diferentes, embora no fundo elas coincidam.

Confiabilidade como a imprecisão de suas medidas: Quando um sujeito responde a um teste, ele obtém uma pontuação empírica, que é afetada por um erro. Se não houvesse erro, o sujeito receberia sua pontuação verdadeira. O teste é impreciso porque a pontuação empírica não corresponde à verdadeira pontuação verdadeira. Essa diferença entre os dois escores é o erro de amostragem, o erro de medição. O erro típico de medição será o desvio padrão dos erros de medição. O erro típico de medição indica a precisão absoluta do teste, pois permite estimar a diferença entre a medida obtida e a que seria obtida se não houvesse erro.

Confiabilidade como a estabilidade das medições: Um teste será mais confiável quanto mais constante ou estável os resultados que ele fornece quando é repetido. Quanto mais estáveis ​​os resultados são em duas ocasiões, maior a correlação entre eles. Essa correlação é chamada coeficiente de confiabilidade. Isso nos expressa, não a quantidade do erro, mas a coerência do teste consigo mesmo e a constância das informações que ele oferece. O coeficiente de confiabilidade expressa a confiabilidade relativa do teste.

O coeficiente de confiabilidade e o índice de confiabilidade: - O coeficiente de confiabilidade de um teste é a correlação do teste consigo mesmo, obtido por exemplo, em duas formas paralelas: rxx. - O índice de precisão é a correlação entre os escores empíricos de um teste e seus escores verdadeiros: rxv O índice de precisão será sempre maior que o coeficiente de confiabilidade Para descobrir o coeficiente de confiabilidade, esses três métodos clássicos são dignos de menção:

  • Encontre a correlação entre o teste e sua repetição: O método de repetição ou teste-reteste: consiste em aplicar o mesmo teste ao mesmo grupo em duas ocasiões e calcula-se a correlação entre as duas séries de pontuações. Essa correlação é o coeficiente de confiabilidade. Este método geralmente fornece um coeficiente de confiabilidade maior do que aqueles obtidos por outros procedimentos e pode estar contaminado por fatores perturbadores..
  • Encontre a correlação entre duas formas paralelas do teste: O método de formas paralelas: Prepare duas formas paralelas do mesmo teste, ou seja, duas formas equivalentes que fornecem as mesmas informações e aplicam-se ao mesmo grupo de indivíduos. A correlação entre as duas formas é o coeficiente de confiabilidade. Com este método, ao não repetir o mesmo teste, evitam-se fontes perturbadoras de confiabilidade do reteste.
  • Encontre a correlação entre duas metades paralelas do teste: Método das duas metades: Divida o teste em duas metades equivalentes e encontre a correlação entre elas. É o método preferível, pois é simples e ignora as limitações dos procedimentos anteriores. Você pode escolher os elementos ímpares do teste, para constituir uma metade, e os elementos pares para constituir a outra metade..

O coeficiente de confiabilidade e a correlação entre testes paralelos

O coeficiente de confiabilidade de um teste indica a proporção em que a verdadeira variância é da variância empírica: graphic33 O coeficiente de confiabilidade de um teste varia entre 0 e 1. Por exemplo: se a correlação entre dois testes paralelos for rxx´ = 0,80, significa que 80% da variância do teste é devido à medida real, e o restante, ou seja, 20% da variância do teste é devido ao erro. O índice de confiabilidade de um teste é a correlação entre seus escores empíricos e seu verdadeiro índice de confiabilidade de escores = O índice de confiabilidade é igual à raiz quadrada do coeficiente de confiabilidade

Uma vez que duas formas paralelas de um teste foram desenvolvidas, o procedimento de análise de variância é aplicado para verificar a homogeneidade das variâncias e a diferença entre as medidas. Se as variâncias são homogêneas, a diferença entre as médias não é significativa e as duas formas são construídas com o mesmo número de elementos do mesmo tipo e conteúdo psicológico, pode-se dizer que elas são paralelas. Se não, você tem que reformá-los até que eles estejam. A falta de confiabilidade é identificada com o valor de rxx´= 0 4.- O erro típico de medição: A diferença entre a pontuação empírica e real é o erro aleatório, chamado erro de medição. O desvio padrão dos erros de medição é chamado de erro típico de medição. O erro típico de medição permite fazer estimativas sobre a confiabilidade absoluta do teste, isto é, estimar quanto erro de medição afeta uma pontuação.

Confiabilidade e comprimento: A duração do teste refere-se ao número de seus elementos. A confiabilidade depende desse comprimento. Se um teste consiste em três elementos, um sujeito pode uma vez obter uma pontuação de 1 e em outra, ou de forma paralela, uma pontuação de

De uma ocasião para outra, a pontuação variou em um ponto; um ponto acima de três é uma variação de 33%, uma variação alta. Se os sujeitos obtiverem variações aleatórias desse tipo, a correlação do teste consigo mesmo ou com as duas formas paralelas do teste será bastante reduzida e não poderá ser alta. Se o teste for muito mais longo, se você tiver, por exemplo, 100 itens, um assunto pode obter 70 pontos em uma ocasião e 67 em uma base paralela. De um para outro, mudou 3 pontos; é uma variação relativamente pequena em relação ao teste total, especificamente 3%. Estas pequenas alterações casuais desta magnitude, que ocorrem nas pontuações dos sujeitos, quando vão de uma forma para a outra, são relativamente pouco importantes e não diminuem tanto quanto antes da correlação entre ambos.

O coeficiente de confiabilidade será muito maior do que no caso anterior. A equação de Spearman-Brown expressa a relação entre confiabilidade e comprimento. A precisão de um teste é zero quando o comprimento é 0 e aumenta à medida que o comprimento aumenta. Embora o aumento seja relativamente menor, o comprimento da parte é maior. Isso significa que a precisão cresce muito no começo e relativamente menos depois. Quando o comprimento tende ao infinito, o coeficiente de confiabilidade tende a

Aumentar a duração de um teste aumenta sua precisão, pois aumenta a variação real a uma taxa maior que a variação de erro. Isso significa que a precisão do teste aumenta porque a proporção de variação devido ao erro diminui. A fórmula de Rulon, assim como a fórmula de Flanagan e Guttman, são especialmente aplicáveis ​​ao calcular o coeficiente de confiabilidade pelo método das duas metades. Essas são fórmulas usadas para calcular o coeficiente de confiabilidade.

Confiabilidade e consistência: O coeficiente de confiabilidade também pode ser encontrado de outra forma, é o chamado coeficiente alfa o coeficiente de generalização ou de representatividade (Cronbach). Esse coeficiente alfa indica a precisão com que alguns itens medem um aspecto de personalidade ou comportamento. Pode ser interpretado como: Uma estimativa da correlação média de todos os itens possíveis em um determinado aspecto. Uma medida da precisão do teste de acordo com sua coerência ou consistência interna (inter-relação entre seus elementos, até que ponto os elementos de teste estão medindo todos da mesma forma) e seu comprimento. Indicando a representatividade do teste, ou seja, a quantidade em que a amostra de itens que o compõe é representativa da população de itens possíveis do mesmo tipo e conteúdo psicológico. O coeficiente alfa reflete principalmente dois conceitos básicos na precisão de um teste: 1. A inter-relação entre seus elementos: a medida em que todos eles medem a mesma coisa.

A duração do teste: aumentando o número de casos em uma amostra, e se os erros sistemáticos são eliminados, a amostra representa melhor a população da qual é extraída e é mais improvável que esteja envolvido erro acidental. Se os itens do teste são dicotômicos, (sim ou não, 1 ou 0, concordância ou discordância, etc.), a equação do coeficiente alfa é simplificada, dando origem às equações de Kuder-Richardson (KR20 e KR21). Dado um certo número de itens, um teste será mais confiável, quando mais homogêneo. O coeficiente alfa nos diz a confiabilidade, pois representa homogeneidade e consistência ou consistência interna dos elementos de um teste..

Critérios de padrões e confiabilidade

De acordo com o modelo do espaço amostral dos itens, o objetivo do teste é estimar a medida que seria obtida se todos os itens no espaço amostral fossem utilizados. Essa medida seria o escore verdadeiro, para o qual as medidas reais se aproximam mais ou menos. Dependendo do grau em que uma amostra de itens se correlaciona com as pontuações verdadeiras, o teste é mais ou menos confiável. Neste modelo, a matriz de correlações entre todos os itens no espaço amostral é central, este modelo de amostra insiste mais diretamente na consistência interna e, na medida em que alcança, indiretamente garante a estabilidade..

O modelo linear de testes paralelos insiste mais na estabilidade dos escores e, na medida em que alcança estabilidade, favorece indiretamente a consistência interna. Se aplicarmos um teste para estabelecer diagnósticos e previsões individuais, o coeficiente de confiabilidade deve ser de 0,90 para acima. Nas previsões e classificações coletivas, a demanda não é tanto, embora não seja conveniente se afastar muito de 0,90 a 0,80..

Às vezes, em certos tipos de testes, como testes de personalidade, é difícil alcançar coeficientes acima de 0,70. Se as formas paralelas, ou metades paralelas, forem aplicadas, após um intervalo mais ou menos grande, os erros aleatórios podem ser mais numerosos do que aqueles que afetam o coeficiente alfa. Isto é assim porque o que diminui a correlação não são apenas os erros aleatórios intrínsecos ao teste e em uma única ocasião, que são aqueles que levam em conta o coeficiente alfa, mas também influenciam todos os erros que podem vir das duas situações diferentes. , que podem diferir em vários detalhes. Portanto, o coeficiente alfa é geralmente maior que os outros coeficientes.

Exceto pelo coeficiente encontrado repetindo o mesmo teste, já que há maior probabilidade de que os erros aleatórios da primeira aplicação sejam repetidos na segunda, e ao invés de diminuir a correlação entre os dois, eles aumentam. Deve ser assegurado que o segundo aplicativo seja completamente independente do primeiro. Se conseguirmos isso, este será o método mais fácil e mais barato e aconselhável ao tentar apreciar a estabilidade das pontuações, especialmente durante longos períodos de tempo e com testes complexos. > Próximo: Validade dos testes