Universidade Federal de Minas Gerais

Departamento de Estatística – ICEx

Métodos Computacionais para Estatística

 

Testes de Aderência – Testes de Bondade de Ajuste

Uma forma de tentar verificar se uma distribuição se ajusta bem ou não aos dados amostrais é através da comparação das freqüências amostrais com as freqüências teóricas esperadas pelo modelo probabilístico que se está julgando válido para descrever os dados observados. Existem testes de hipóteses, chamados testes de aderência, que servem para testar hipóteses mais gerais sobre a distribuição dos dados, enquanto que outros são específicos para determinados modelos teóricos.  A idéia básica é que, dada uma amostra aleatória de tamanho n, observada de uma variável aleatória X, nosso objetivo é testar:

H0: X tem distribuição f    vs    H1: X não tem distribuição f.

A metodologia baseia-se na construção de uma função com os dados amostrais, comparando-a com a distribuição teórica de acordo com alguma métrica. Os métodos variam de acordo com a função amostral construída e da métrica utilizada para comparação.

Utilizaremos o pacote estatístico MINITAB para verificar alguns testes disponíveis.

Teste de Ryan-Joiner: O teste busca testar se os dados provém ou não de uma distribuição normal. Se o modelo for adequado o gráfico construído com os dados amostrais deve mostrar uma linha reta. O método baseia-se na construção de um modelo de regressão que verifica quão bom é o ajuste do modelo de regressão. Shapiro-Wilkis propuseram uma outra estatística de teste, diferente da original.

Teste de Anderson-Darling: O teste de aderência serve para testar hipóteses de aderência para modelos contínuos.
Whtherill (1986) mostrou que o teste de Shapiro-Wilks é mais poderoso para amostras menores ou iguais a 50, enquanto que o teste de Anderson-Darling tem mais poder para amostras maiores de 50.

Teste de Kolmogorov-Smirnov para Aderência: O teste de Kolmogorov-Smirnof também presta para testarmos a hipótese de que um conjunto de dados provém ou não de uma determinada distribuição. Neste caso, a comparação é feita considerando-se a função de distribuição empírica e a função de distribuição teórica esperada para os valores amostrais observados. A estatística distância é a maior diferença observada.

O Minitab oferece o Probability Plot que pode ser usado para verificar o ajuste de uma amostra a vários tipos de distribuição

 

Exercícios

1.        Complemente o exercício c) do roteiro Simulação, realizando os testes de aderência disponíveis (Anderson-Darling, Ryan-Joyner, Kolmogorov-Smirnov e o Probability Plot apropriado). Compare os resultados obtidos.

2.        Complemente o exercício d) do roteiro Simulação, realizando os testes de aderência disponíveis. Teste normalidade e aderência à distribuição exponencial. Compare os resultados com todos os testes disponíveis.