O que é Goodness-Of-Fit?
O teste de Goodness-of-fit é um teste de hipótese estatística para ver até que ponto os dados da amostra se ajustam a uma distribuição de uma população com uma distribuição normal. Colocado de forma diferente, este teste mostra se os dados da sua amostra representam os dados que esperaria encontrar na população real ou se são, de alguma forma, enviesados. Goodness-of-fit estabelece a discrepância entre os valores observados e aqueles que seriam esperados do modelo num caso de distribuição normal.
Existem múltiplos métodos para determinar a goodness-of-fit. Alguns dos métodos mais populares utilizados nas estatísticas incluem o qui-quadrado, o teste Kolmogorov-Smirnov, o teste Anderson-Darling, e o teste Shipiro-Wilk.
Key Takeaways
- Testes de adequação são testes estatísticos destinados a determinar se um conjunto de valores observados corresponde aos esperados sob o modelo aplicável.
- Existem múltiplos tipos de testes de adequação, mas o mais comum é o teste do qui-quadrado.
- O teste Kolmogorov-Smirnov – utilizado para amostras grandes – determina se uma amostra provém de uma distribuição específica de uma população.
- Os testes de Goodness-of-fit podem mostrar se os dados da sua amostra se enquadram num conjunto esperado de dados de uma população com distribuição normal.
Compreender Goodness-Of-Fit
Os testes de Goodness-of-fit são métodos estatísticos frequentemente utilizados para fazer inferências sobre valores observados. Estes testes determinam como os valores reais estão relacionados com os valores previstos num modelo, e quando usados na tomada de decisões, os testes de goodness-of-fit podem ajudar a prever tendências e padrões futuros.
O teste de goodness-of-fit mais comum é o teste do qui-quadrado, tipicamente usado para distribuições discretas. O teste de qui-quadrado é usado exclusivamente para dados colocados em classes (caixas), e requer um tamanho de amostra suficiente para produzir resultados precisos.
Tipos de testes de Goodness-Of-Fit
Teste de qui-quadrado
O teste de qui-quadrado, também conhecido como teste de independência, é um método estatístico inferencial que testa a validade de uma alegação feita sobre uma população com base numa amostra aleatória. No entanto, não indica o tipo ou a intensidade da relação. Por exemplo, não conclui se a relação é positiva ou negativa.
Para ser elegível para o teste do qui-quadrado para a independência, as variáveis devem ser mutuamente exclusivas.
Para calcular uma adequação do qui-quadrado, é necessário definir o nível alfa desejado de significância (por exemplo, se o seu nível de confiança for 95% ou .95, então o alfa é .05), identificar as variáveis categóricas a testar, e definir declarações de hipóteses sobre as relações entre elas. A hipótese nula afirma que não existe qualquer relação entre as variáveis, e a hipótese alternativa assume que existe uma relação. A frequência dos valores observados é medida e subsequentemente utilizada com os valores esperados e os graus de liberdade para calcular o qui-quadrado. Se o resultado for inferior ao alfa, a hipótese nula é inválida, indicando que existe uma relação entre as variáveis.
Teste Kolmogorov-Smirnov
Nomeado depois dos matemáticos russos Andrey Kolmogorov e Nikolai Smirnov, o teste Kolmogorov-Smirnov (também conhecido como teste K-S) é um método estatístico que determina se uma amostra é de uma distribuição específica dentro de uma população. O teste de Kolmogorov-Smirnov recomendado para amostras grandes (por exemplo, mais de 2000) – não é paramétrico, o que significa que não depende de qualquer distribuição para ser válido. O objectivo é provar a hipótese nula, que é a amostra da distribuição normal.
Contrário ao teste do qui-quadrado, o teste de Kolmogorov-Smirnov aplica-se a distribuições contínuas. Tal como o qui-quadrado, utiliza uma hipótese nula e alternativa e um nível alfa de significância. Nula indica que os dados seguem uma distribuição específica dentro da população, e alternativa indica que os dados não seguiram uma distribuição específica dentro da população. O alfa é usado para determinar o valor crítico usado no teste.
A estatística calculada do teste, frequentemente designada por D, determina se a hipótese nula é aceite ou rejeitada. Se D for maior que o valor crítico em alfa, a hipótese nula é rejeitada. Se D for menor que o valor crítico, a hipótese nula é aceite, indicando
Teste Shipiro-Wilk
O teste Shipiro-Wilk determina se uma amostra segue uma distribuição normal. Utilizando uma amostra com uma variável de dados contínuos, o teste Shipiro-Wilk verifica apenas a normalidade. É recomendado para amostras de pequenas dimensões até 2000. Tal como as outras, utiliza alfa e forma duas hipóteses: nula e alternativa. A hipótese nula afirma que a amostra provém da distribuição normal, enquanto que a hipótese alternativa afirma que a amostra não provém da distribuição normal.
O teste Shipiro-Wilk utiliza um gráfico de probabilidade chamado QQ Plot. Este gráfico de dispersão exibe visualmente dois conjuntos de quantis no eixo y, dispostos do mais pequeno para o maior. Se cada quantil tiver vindo da mesma distribuição, o gráfico de dispersão exibirá uma série linear de parcelas. O teste Shipiro-Wilk utiliza o QQ Plot para estimar a variância. Usando a variância do QQ Plot juntamente com a variância estimada da população, pode-se determinar se a amostra pertence a uma distribuição normal. Se o quociente de ambas as variâncias for igual ou próximo de 1, então a hipótese nula pode ser aceite. Se consideravelmente inferior a 1, pode ser rejeitada.
Exemplo de um teste de Goodness-of-Fit
Por exemplo, um pequeno ginásio comunitário pode estar a funcionar sob o pressuposto de que tem a sua maior frequência às segundas, terças e sábados, a média de frequência às quartas, e quintas, e a menor frequência às sextas e domingos. Com base nestes pressupostos, o ginásio emprega um certo número de membros do pessoal todos os dias para verificar os membros, limpar as instalações, oferecer serviços de treino, e dar aulas.
No entanto, o ginásio não está a ter um bom desempenho financeiro e o proprietário quer saber se estes pressupostos de assistência e os níveis de pessoal estão correctos. O proprietário decide contar o número de frequentadores do ginásio todos os dias durante seis semanas. Ele pode então comparar a assistência presumida do ginásio com a sua assistência observada utilizando, por exemplo, um teste de adequação do qui-quadrado. Com os novos dados, ele pode determinar a melhor forma de gerir o ginásio e melhorar a rentabilidade.
FAQs de Goodness-of-Fit
O que significa Goodness-of-Fit?
Goodness-of-Fit é um teste estatístico de hipóteses utilizado para ver o quão de perto os dados observados espelham os dados esperados. Os testes de Goodness-of-Fit podem ajudar a determinar se uma amostra segue uma distribuição normal, se variáveis categóricas estão relacionadas, ou se amostras aleatórias são da mesma distribuição.
Porque é que Goodness-of-Fit é importante?
Testes de Goodness-of-Fit ajudam a determinar se os dados observados se alinham com o que é esperado. As decisões podem ser tomadas com base no resultado do teste de hipóteses realizado. Por exemplo, um retalhista quer saber que produto oferece aos jovens. O retalhista pesquisa uma amostra aleatória de idosos e jovens para identificar qual o produto preferido. Utilizando o qui-quadrado, identificam que, com 95% de confiança, existe uma relação entre o produto A e os jovens. Com base nestes resultados, poder-se-ia determinar que esta amostra representa a população de jovens adultos. Os comerciantes retalhistas podem utilizar isto para reformar as suas campanhas.
O que é que o teste do qui-quadrado permite?
O teste do qui-quadrado verifica se existem relações entre variáveis categóricas e se a amostra representa o todo. Estima o quão próximo os dados observados espelham os dados esperados, ou quão bem se encaixam.
Como se faz o Teste de Goodness-of-Fit?
O teste Goodness-of-Fit consiste em diferentes métodos de teste. O objectivo do teste ajudará a determinar qual o método a utilizar. Por exemplo, se o objectivo for testar a normalidade numa amostra relativamente pequena, o teste Shipiro-Wilk pode ser adequado. Se se quiser determinar se uma amostra provém de uma distribuição específica dentro de uma população, será utilizado o teste Kolmogorov-Smirnov. Cada teste usa a sua própria fórmula única. No entanto, têm pontos comuns, tais como uma hipótese nula e nível de significância.
O resultado final
Testes de adequação da amostra determinam quão bem os dados da amostra se ajustam ao que se espera de uma população. A partir dos dados da amostra, é recolhido um valor observado e comparado com o valor esperado calculado, usando uma medida de discrepância. Existem diferentes testes de hipóteses de goodness-of-fit disponíveis, dependendo do resultado que se procura.
A escolha do teste de goodness-of-fit correcto depende em grande parte do que se quer saber sobre uma amostra e do tamanho da amostra. Por exemplo, se quiser saber se os valores observados para dados categóricos correspondem aos valores esperados para dados categóricos, utilize o qui-quadrado. Se quiser saber se uma pequena amostra segue uma distribuição normal, o teste Shipiro-Wilk pode ser vantajoso. Há muitos testes disponíveis para determinar a adequação.