Universidade Federal de Minas
Gerais
Departamento de Estatística –
ICEx
Métodos Computacionais para
Estatística
Testes
de Aderência – Testes de Bondade de Ajuste
Uma forma de tentar
verificar se uma distribuição se ajusta bem ou não aos dados amostrais é através
da comparação das freqüências amostrais com as freqüências teóricas esperadas
pelo modelo probabilístico que se está julgando válido para descrever os dados
observados. Existem testes de hipóteses, chamados testes de aderência, que
servem para testar hipóteses mais gerais sobre a distribuição dos dados,
enquanto que outros são específicos para determinados modelos teóricos. A idéia básica é que, dada uma amostra
aleatória de tamanho n, observada de
uma variável aleatória X, nosso
objetivo é testar:
H0:
X tem distribuição f
vs
H1: X não tem distribuição f.
A metodologia
baseia-se na construção de uma função com os dados amostrais, comparando-a com
a distribuição teórica de acordo com alguma métrica. Os métodos variam de
acordo com a função amostral construída e da métrica
utilizada para comparação.
Utilizaremos o pacote estatístico MINITAB para verificar alguns testes
disponíveis.
Teste de Ryan-Joiner: O teste busca testar se os dados
provém ou não de uma distribuição normal. Se o modelo for adequado o gráfico construído com os dados amostrais deve mostrar uma
linha reta. O método baseia-se na construção de um modelo de regressão que
verifica quão bom é o ajuste do modelo de regressão. Shapiro-Wilkis
propuseram uma outra estatística de teste, diferente da original.
Teste de Anderson-Darling: O teste de aderência serve para testar hipóteses de
aderência para modelos contínuos.
Whtherill (1986) mostrou que o teste de Shapiro-Wilks é mais poderoso para amostras menores ou
iguais a 50, enquanto que o teste de Anderson-Darling
tem mais poder para amostras maiores de 50.
Teste de Kolmogorov-Smirnov para Aderência: O teste de Kolmogorov-Smirnof
também presta para testarmos a hipótese de que um
conjunto de dados provém ou não de uma determinada distribuição. Neste caso, a
comparação é feita considerando-se a função de distribuição empírica e a função
de distribuição teórica esperada para os valores amostrais observados. A
estatística distância é a maior diferença observada.
O Minitab oferece o Probability Plot que pode ser
usado para verificar o ajuste de uma amostra a vários tipos de distribuição
Exercícios
1.
Complemente
o exercício c) do roteiro Simulação, realizando os testes de aderência
disponíveis (Anderson-Darling, Ryan-Joyner,
Kolmogorov-Smirnov e o Probability
Plot apropriado). Compare os resultados obtidos.
2.
Complemente
o exercício d) do roteiro Simulação, realizando os testes de aderência
disponíveis. Teste normalidade e aderência à distribuição exponencial. Compare
os resultados com todos os testes disponíveis.