Goodness-of-Fit

Was ist Goodness-Of-Fit?

Der Goodness-of-Fit-Test ist ein statistischer Hypothesentest, um festzustellen, wie gut die Stichprobendaten zu einer Verteilung aus einer normalverteilten Grundgesamtheit passen. Anders ausgedrückt, dieser Test zeigt, ob Ihre Stichprobendaten die Daten repräsentieren, die Sie in der tatsächlichen Population erwarten würden, oder ob sie irgendwie schief sind. Die Anpassungsgüte (Goodness-of-Fit) ermittelt die Diskrepanz zwischen den beobachteten Werten und denen, die man bei einer Normalverteilung vom Modell erwarten würde.

Es gibt mehrere Methoden zur Bestimmung der Anpassungsgüte (Goodness-of-Fit). Einige der bekanntesten Methoden, die in der Statistik verwendet werden, sind der Chi-Quadrat-Test, der Kolmogorov-Smirnov-Test, der Anderson-Darling-Test und der Shipiro-Wilk-Test.

Key Takeaways

  • Goodness-of-fit-Tests sind statistische Tests, die darauf abzielen, festzustellen, ob eine Reihe von beobachteten Werten mit denen übereinstimmen, die unter dem anwendbaren Modell erwartet werden.
  • Es gibt mehrere Arten von Goodness-of-fit-Tests, aber der häufigste ist der Chi-Quadrat-Test.
  • Der Chi-Quadrat-Test bestimmt, ob eine Beziehung zwischen kategorialen Daten besteht.
  • Der Kolmogorov-Smirnov-Test, der für große Stichproben verwendet wird, bestimmt, ob eine Stichprobe aus einer bestimmten Verteilung einer Population stammt.
  • Goodness-of-Fit-Tests können Ihnen zeigen, ob Ihre Stichprobendaten einem erwarteten Datensatz aus einer Grundgesamtheit mit Normalverteilung entsprechen.

Goodness-Of-Fit verstehen

Goodness-of-Fit-Tests sind statistische Methoden, die häufig verwendet werden, um Rückschlüsse auf beobachtete Werte zu ziehen. Diese Tests bestimmen, wie sehr die tatsächlichen Werte mit den vorhergesagten Werten in einem Modell zusammenhängen, und wenn sie bei der Entscheidungsfindung verwendet werden, können Goodness-of-Fit-Tests helfen, zukünftige Trends und Muster vorherzusagen.

Der häufigste Goodness-of-Fit-Test ist der Chi-Quadrat-Test, der typischerweise für diskrete Verteilungen verwendet wird. Der Chi-Quadrat-Test wird ausschließlich für Daten verwendet, die in Klassen (Bins) eingeteilt sind, und er erfordert einen ausreichenden Stichprobenumfang, um genaue Ergebnisse zu liefern.

Goodness-of-fit-Tests werden häufig verwendet, um auf die Normalität von Residuen zu testen oder um festzustellen, ob zwei Stichproben aus identischen Verteilungen gewonnen wurden.

Arten von Goodness-Of-Fit-Tests

Chi-Quadrat-Test

Der Chi-Quadrat-Test, auch bekannt als Chi-Quadrat-Test auf Unabhängigkeit, ist eine Methode der Inferenzstatistik, die die Gültigkeit einer Aussage über eine Grundgesamtheit auf Basis einer Stichprobe testet. Er sagt jedoch nichts über die Art oder Intensität der Beziehung aus. Er sagt zum Beispiel nicht aus, ob die Beziehung positiv oder negativ ist.

Um für den Chi-Quadrat-Test auf Unabhängigkeit in Frage zu kommen, müssen sich die Variablen gegenseitig ausschließen.

Um eine Chi-Quadrat-Anpassungsgüte zu berechnen, ist es notwendig, das gewünschte Alpha-Niveau der Signifikanz festzulegen (z.B., wenn Ihr Konfidenzniveau 95% oder .95 ist, dann ist das Alpha gleich .05), die zu testenden kategorialen Variablen zu identifizieren und Hypothesenaussagen über die Beziehungen zwischen ihnen zu definieren. Die Nullhypothese behauptet, dass keine Beziehung zwischen den Variablen besteht, und die Alternativhypothese nimmt an, dass eine Beziehung besteht. Die Häufigkeit der beobachteten Werte wird gemessen und anschließend mit den erwarteten Werten und den Freiheitsgraden zur Berechnung von Chi-Quadrat verwendet. Wenn das Ergebnis kleiner als Alpha ist, ist die Nullhypothese ungültig, was darauf hindeutet, dass eine Beziehung zwischen den Variablen besteht.

Kolmogorov-Smirnov-Test

Benannt nach den russischen Mathematikern Andrey Kolmogorov und Nikolai Smirnov, ist der Kolmogorov-Smirnov-Test (auch als K-S-Test bekannt) eine statistische Methode, die bestimmt, ob eine Stichprobe aus einer bestimmten Verteilung innerhalb einer Population stammt. Der Kolmogorov-Smirnov-Test – empfohlen für große Stichproben (z. B. über 2000) – ist nicht parametrisch, d. h. er ist nicht auf eine bestimmte Verteilung angewiesen, um gültig zu sein. Sein Ziel ist es, die Nullhypothese zu beweisen, die die Stichprobe der Normalverteilung ist.

Im Gegensatz zum Chi-Quadrat-Test gilt der Kolmogorov-Smirnov-Test für kontinuierliche Verteilungen. Wie Chi-Quadrat verwendet er eine Null- und eine Alternativhypothese sowie ein Alpha-Signifikanzniveau. Die Nullhypothese gibt an, dass die Daten einer bestimmten Verteilung innerhalb der Grundgesamtheit folgen, und die Alternativhypothese gibt an, dass die Daten keiner bestimmten Verteilung innerhalb der Grundgesamtheit folgen. Das Alpha-Niveau wird verwendet, um den kritischen Wert zu bestimmen, der im Test verwendet wird.

Die berechnete Teststatistik, oft als D bezeichnet, bestimmt, ob die Nullhypothese angenommen oder abgelehnt wird. Wenn D größer ist als der kritische Wert bei Alpha, wird die Nullhypothese abgelehnt. Wenn D kleiner als der kritische Wert ist, wird die Nullhypothese angenommen, was anzeigt

Shipiro-Wilk-Test

Der Shipiro-Wilk-Test bestimmt, ob eine Stichprobe einer Normalverteilung folgt. Unter Verwendung einer Stichprobe mit einer Variablen mit kontinuierlichen Daten prüft der Shipiro-Wilk-Test nur auf Normalität. Er wird für kleine Stichprobengrößen bis zu 2000 empfohlen. Wie die anderen verwendet er Alpha und bildet zwei Hypothesen: Null- und Alternativhypothese. Die Nullhypothese besagt, dass die Stichprobe aus der Normalverteilung stammt, während die Alternativhypothese besagt, dass die Stichprobe nicht aus der Normalverteilung stammt.

Der Shipiro-Wilk-Test verwendet ein Wahrscheinlichkeitsdiagramm, das QQ-Plot genannt wird. Dieses Streudiagramm zeigt visuell zwei Sätze von Quantilen auf der y-Achse an, die vom kleinsten zum größten angeordnet sind. Wenn jedes Quantil aus der gleichen Verteilung stammt, zeigt das Streudiagramm eine lineare Reihe von Plots an. Der Shipiro-Wilk-Test verwendet den QQ Plot, um die Varianz zu schätzen. Durch die Verwendung der QQ-Plot-Varianz zusammen mit der geschätzten Varianz der Grundgesamtheit kann man feststellen, ob die Stichprobe zu einer Normalverteilung gehört. Wenn der Quotient beider Varianzen gleich oder nahe bei 1 ist, kann die Nullhypothese angenommen werden. Wenn sie deutlich kleiner als 1 ist, kann sie verworfen werden.

Beispiel für einen Goodness-of-Fit-Test

Ein kleines kommunales Fitnessstudio könnte beispielsweise unter der Annahme arbeiten, dass es montags, dienstags und samstags die höchste Besucherzahl hat, mittwochs und donnerstags die durchschnittliche Besucherzahl und freitags und sonntags die niedrigste Besucherzahl. Basierend auf diesen Annahmen beschäftigt das Fitnessstudio jeden Tag eine bestimmte Anzahl von Mitarbeitern, um die Mitglieder einzuchecken, die Einrichtungen zu reinigen, Trainingsdienste anzubieten und Kurse zu geben.

Das Fitnessstudio schneidet jedoch finanziell nicht gut ab, und der Eigentümer möchte wissen, ob diese Annahmen bezüglich der Besucherzahlen und des Personalbestands korrekt sind. Der Besitzer beschließt, sechs Wochen lang jeden Tag die Besucher des Fitnessstudios zu zählen. Anschließend kann er die angenommenen Besucherzahlen des Fitnessstudios mit den beobachteten Besucherzahlen vergleichen, indem er z. B. einen Chi-Quadrat-Goodness-of-Fit-Test verwendet. Mit den neuen Daten kann er feststellen, wie er das Fitnessstudio am besten verwalten und die Rentabilität verbessern kann.

Goodness-of-Fit FAQs

Was bedeutet Goodness-of-Fit?

Goodness-of-Fit ist ein statistischer Hypothesentest, der verwendet wird, um zu sehen, wie genau die beobachteten Daten die erwarteten Daten widerspiegeln. Goodness-of-Fit-Tests können dabei helfen festzustellen, ob eine Stichprobe einer Normalverteilung folgt, ob kategoriale Variablen zusammenhängen oder ob Stichproben aus derselben Verteilung stammen.

Warum ist Goodness-of-Fit wichtig?

Goodness-of-Fit-Tests helfen festzustellen, ob beobachtete Daten mit dem Erwarteten übereinstimmen. Auf Basis des Ergebnisses des durchgeführten Hypothesentests können Entscheidungen getroffen werden. Ein Beispiel: Ein Einzelhändler möchte wissen, welches Produktangebot junge Menschen anspricht. Der Einzelhändler befragt eine Zufallsstichprobe von alten und jungen Menschen, um festzustellen, welches Produkt bevorzugt wird. Mit Hilfe von Chi-Quadrat wird festgestellt, dass mit 95 %iger Sicherheit ein Zusammenhang zwischen Produkt A und jungen Menschen besteht. Anhand dieser Ergebnisse könnte man feststellen, dass diese Stichprobe die Population der jungen Erwachsenen repräsentiert. Einzelhandelsvermarkter können dies nutzen, um ihre Kampagnen zu reformieren.

Was ist Goodness-of-Fit beim Chi-Quadrat-Test?

Der Chi-Quadrat-Test prüft, ob Beziehungen zwischen kategorialen Variablen bestehen und ob die Stichprobe die Gesamtheit repräsentiert. Er schätzt ab, wie genau die beobachteten Daten die erwarteten Daten widerspiegeln, oder wie gut sie passen.

Wie wird der Goodness-of-Fit-Test durchgeführt?

Der Goodness-of-FIt-Test besteht aus verschiedenen Testmethoden. Das Ziel des Tests hilft bei der Entscheidung, welche Methode zu verwenden ist. Wenn das Ziel beispielsweise darin besteht, die Normalität bei einer relativ kleinen Stichprobe zu testen, kann der Shipiro-Wilk-Test geeignet sein. Wenn man feststellen möchte, ob eine Stichprobe aus einer bestimmten Verteilung innerhalb einer Population stammt, wird der Kolmogorov-Smirnov-Test verwendet. Jeder Test verwendet seine eigene einzigartige Formel. Sie haben jedoch Gemeinsamkeiten, wie z. B. eine Nullhypothese und ein Signifikanzniveau.

Das Fazit

Goodness-of-fit-Tests bestimmen, wie gut die Stichprobendaten zu dem passen, was von einer Population erwartet wird. Aus den Stichprobendaten wird ein Beobachtungswert ermittelt und mit einem Diskrepanzmaß mit dem berechneten Erwartungswert verglichen. Es gibt verschiedene Goodness-of-Fit-Hypothesentests, je nachdem, welches Ergebnis Sie suchen.

Die Auswahl des richtigen Goodness-of-Fit-Tests hängt weitgehend davon ab, was Sie über eine Stichprobe wissen möchten und wie groß die Stichprobe ist. Wenn Sie z. B. wissen möchten, ob beobachtete Werte für kategoriale Daten mit den erwarteten Werten für kategoriale Daten übereinstimmen, verwenden Sie Chi-Quadrat. Wenn Sie wissen möchten, ob eine kleine Stichprobe einer Normalverteilung folgt, könnte der Shipiro-Wilk-Test von Vorteil sein. Es sind viele Tests zur Bestimmung der Anpassungsgüte verfügbar.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.