Bootstrapping: Konfidenzintervalle ermitteln

Die Bootstrapping-Funktion von TableTorch berechnet Konfidenzintervalle zu einem vorgegebenen Konfidenzniveau für die folgenden gängigen Maßzahlen jeder ausgewählten Variable:

Mittelwert (Durchschnitt);
Varianz;
Standardabweichung;
25. Perzentil;
Median (50. Perzentil);
75. Perzentil.

Sie kann eine ausgewählte Spalte auch beliebig oft per Zufallsstichprobe neu ziehen, sodass Sie die gewünschte Statistik manuell auf einem separaten Blatt berechnen können.

In diesem Artikel betrachten wir mögliche Anwendungsfälle des statistischen Bootstrappings und lernen, wie Sie die Bootstrapping-Funktion von TableTorch verwenden.

Inhaltsverzeichnis

Anwendungen von Bootstrapping
Erste Schritte mit TableTorch
Berechnung der gängigen Maßzahlen
N-faches Resampling einer einzelnen Spalte
- Bootstrapping einer benutzerdefinierten Metrik
Fazit

Anwendungen von Bootstrapping

Die Bootstrapping-Methode hat zahlreiche Anwendungen sowohl in der Wirtschaft als auch in der Wissenschaft, zum Beispiel:

Schätzung von Konfidenzintervallen: Konstruktion von Konfidenzintervallen für Populationsparameter.
Modellvalidierung: Bewertung der Stabilität und Genauigkeit von Vorhersagemodellen.
Risikobewertung: Schätzung der Wahrscheinlichkeit finanzieller Verluste und anderer Risiken.
Marktforschung: Analyse von Kundendaten zur Vorhersage von Trends und Präferenzen.
Leistungsbewertung: Bewertung der Mitarbeiterleistung und Produktivität.
Lagerverwaltung: Bedarfsprognose und Optimierung von Lagerbeständen.
Finanzmodellierung: Simulation wirtschaftlicher Szenarien zur Unterstützung von Investitionsentscheidungen.
Vergleichsstudien: Vergleich verschiedener Gruppen oder Bedingungen in der experimentellen Forschung.

Im Folgenden gehen wir näher auf die Details des Bootstrappings ein. Bevor wir fortfahren, vergewissern Sie sich bitte, dass Sie das TableTorch-Add-on für Google Tabellen installiert haben, wie im folgenden Abschnitt beschrieben.

Erste Schritte mit TableTorch

Installieren Sie TableTorch für Google Tabellen über den Google Workspace Marketplace. Weitere Informationen zur Ersteinrichtung.
Klicken Sie auf das TableTorch-Symbol im rechten Seitenbereich von Google Tabellen.

Berechnung der gängigen Maßzahlen

Beispieldaten

Beginnen wir mit folgendem Blatt:

A	B
New Design: Before	New Design: After
9.7	8.1
13.9	13.2
10.9	9.2
12.4	9.6
11.5	10.6
13.8	12.1
11.6	9.7
12.5	10.3
13.6	11.8
12.5	11.8
12.7	11.3
12.3	10.9
13.6	12.3
11.4	9.7
14.6	12.7
12.1	9.9
8.9	8.1
12.5	10.4
11.8	11.4
12.4	10.7
15.0	13.8
12.0	10.9
11.9	10.7
12.4	10.5
8.3	6.8
11.5	10.0
13.0	10.9
12.5	10.8
10.4	8.9
13.9	12.2
11.6	11.0
7.7	6.4
9.8	8.4
15.5	14.5
11.2	9.1
13.2	11.5
11.3	10.0
10.4	8.5
13.1	12.6
13.8	12.1
10.4	8.5
13.5	11.8
13.5	12.3
13.7	11.6
13.2	11.3
11.8	10.9
13.1	11.7
12.5	11.8
13.7	11.9
12.5	11.6

Dieses Blatt wird auch auf der Seite Hypothesentests referenziert. Es beschreibt die Zeit in Sekunden, die Teilnehmer eines Experiments benötigten, um eine bestimmte Aktion vor und nach einer UI-Designänderung durchzuführen.

Berechnung

➡️ Wählen Sie eine beliebige Zelle der Datentabelle aus, öffnen Sie TableTorch und klicken Sie auf den Menüpunkt Bootstrapping.
➡️ Passen Sie bei Bedarf die Optionen an und klicken Sie auf die Schaltfläche Compute.
- Konfidenzniveau — standardmäßig 95 %, gibt die Wahrscheinlichkeit an, dass das Konfidenzintervall den wahren Parameter enthält. Allgemein gilt: Je höher das Konfidenzniveau, desto breiter ist das berechnete Konfidenzintervall.
- Parameter zur Berechnung — standardmäßig werden Mittelwert, 25., 50. und 75. Perzentil berechnet, aber Sie können auch Varianz und Standardabweichung einbeziehen.
- Ausgabeformat — bestimmt das Format des Ergebnisblatts. Wählen wir mean ± half range, separately zur Vereinfachung. Auf diese Weise wird jede Maßzahl mit einem Mittelwert in einer Spalte und der Hälfte des Bereichs (Fehlerspanne) in einer anderen Spalte dargestellt.
- Anzahl der Resamples — legt fest, wie viele Datensatz-Resamples TableTorch während des Bootstrappings durchführt, um die angeforderten gängigen Maßzahlen zu berechnen.
Die Ergebnisse werden auf einem neuen Blatt angezeigt.

Analyse der per Bootstrapping ermittelten Kennzahlen

Wenn wir die Ergebnisse transponieren und als drei Spalten für die Minima, Mittelwerte und Maxima der Konfidenzintervalle darstellen, ergibt sich die folgende Tabelle:

A	B	C
Mittelwert	New Design: Before	New Design: After
Minimum	11.78	10.3
Mean	12.19	10.77
Maximum	12.66	11.2

25. Perzentil	New Design: Before	New Design: After
Minimum	10.54	8.95
Mean	11.22	9.83
Maximum	11.98	10.61

Median	New Design: Before	New Design: After
Minimum	11.88	10.49
Mean	12.34	10.96
Maximum	12.68	11.47

75. Perzentil	New Design: Before	New Design: After
Minimum	12.54	11.44
Mean	13.18	11.78
Maximum	13.68	12.22

Die Hypothese des Experiments war, dass das neue Design die Zeit verkürzen würde, die ein Nutzer benötigt, um eine bestimmte Aktion auszuführen. Schauen wir uns an, ob die per Bootstrapping ermittelten Metriken dies unterstützen:

Die durchschnittliche Zeit verringerte sich um 1,42 Sekunden (12,19 − 10,77).
Die obere Grenze des 95 %-Konfidenzintervalls für die durchschnittliche Zeit nach der Intervention liegt bei 11,2 und damit unter der unteren Grenze des Konfidenzintervalls von 11,78 für die durchschnittliche Zeit vor der Intervention. Das deutet darauf hin, dass die Änderung der durchschnittlichen Zeit mit 95 %iger Sicherheit nicht auf Zufall beruht und einen Effekt von mindestens −0,58 Sekunden zeigt.
Der Median und das 75. Perzentil zeigen ebenfalls signifikante Abnahmen:
- Der Median verringerte sich um mindestens 0,41 Sekunden.
- Das 75. Perzentil verringerte sich um 0,32 Sekunden.
Beim 25. Perzentil überlappen sich die Konfidenzintervalle leicht. Zwar liegt das Konfidenzintervall nach der Intervention niedriger als davor, doch deutet dies darauf hin, dass der Effekt für die schnellsten 25 % der Nutzer möglicherweise nicht statistisch signifikant ist.

* — Erfahren Sie mehr über dieses Experiment auf der Seite über Hypothesentests.

N-faches Resampling einer einzelnen Spalte

TableTorch ist sehr hilfreich bei der Berechnung gängiger Kennzahlen, wie in den vorherigen Abschnitten dieses Artikels beschrieben.

Es unterstützt Sie aber auch beim Bootstrapping jeder beliebigen Kennzahl, sofern sich diese mit einer einfachen Google-Tabellen-Formel berechnen lässt.

Im folgenden Abschnitt zeigen wir, wie Sie dabei vorgehen.

Bootstrapping einer benutzerdefinierten Metrik

Zu Demonstrationszwecken ermitteln wir per Bootstrapping die Differenz zwischen dem kleinsten und dem größten Messwert, also die Spannweite der Messwerte des oben dargestellten Datensatzes.

Schritt 1: Resampling der ursprünglichen Spalte

➡️ Wählen Sie eine beliebige Zelle der Datentabelle aus, öffnen Sie TableTorch und klicken Sie auf den Menüpunkt Bootstrapping.
➡️ Passen Sie bei Bedarf die Optionen an und klicken Sie auf die Schaltfläche Resample.
- Wählen Sie die Spalte für das Resampling aus: New Design: Before in diesem Beispiel.
- Wählen Sie die Anzahl der Resamples: 599 in diesem Beispiel.
  
  HINWEIS: Je nach Größe des ursprünglichen Datensatzes ist aufgrund der Beschränkung von Google Tabellen auf die Anzahl der Zellen mit Daten in einer einzelnen Tabelle möglicherweise nicht immer eine so hohe Anzahl an Resamples machbar.
Kurz darauf erscheint ein Blatt mit 599 Stichproben der ursprünglichen Spalte.

Schritt 2: Berechnen Sie die gewünschte Metrik für alle Resamples

Setzen wir nun unter die erste neu gezogene Spalte eine Formel zur Berechnung der Spannweite:
```
 =MAX(A4:A52) - MIN(A4:A52)
```
Kopieren Sie dann diese Formel einfach horizontal für alle erzeugten Spalten:

Schritt 3: Berechnen Sie das Konfidenzintervall

Geben Sie nun die Formeln in die Zeilen 56–60 ein, um das 95 %-Konfidenzintervall zu berechnen:

Untere Grenze des 95 %-Konfidenzintervalls:
```
=PERCENTILE(A54:WA54, 0.025)
```
Obere Grenze des 95 %-Konfidenzintervalls:
```
=PERCENTILE(A54:WA54, 0.975)
```
Mittelwert:
```
=AVERAGE(B56:B57)
```
Fehlerspanne:
```
=(B57-B56)/2
```

95 %-Konfidenzintervall:

=CONCATENATE(TEXT(B58, "0.00"), " ± ", TEXT(B59, "0.00"))

Auf diese Weise lässt sich jede Kennzahl, die sich mit einer Google-Tabellen-Formel berechnen lässt, per Bootstrapping untersuchen. Wenn Sie stattdessen ein 99 %-Konfidenzintervall berechnen möchten, ersetzen Sie in den obigen Formeln einfach die Perzentile durch 0.005 und 0.995.

Fazit

Die Bootstrapping-Funktion des TableTorch-Add-ons für Google Tabellen bietet ein robustes, benutzerfreundliches Werkzeug zur Berechnung genauer Konfidenzintervalle, ohne sich auf traditionelle Verteilungsannahmen verlassen zu müssen. In diesem Artikel haben wir gezeigt, wie sich gängige Kennzahlen wie Mittelwerte, Mediane sowie das 25. und 75. Perzentil per Bootstrapping ermitteln lassen — ebenso jede benutzerdefinierte Kennzahl, die sich mit Google-Tabellen-Formeln berechnen lässt.

Die nahtlose Integration von TableTorch in Google Tabellen sorgt dafür, dass sowohl Einsteiger als auch erfahrene Analysten Resampling-Techniken effektiv einsetzen können, um zuverlässige Konfidenzintervalle zu berechnen.

Google, Google Tabellen, Google Workspace und YouTube sind Marken von Google LLC. Gaujasoft TableTorch ist nicht mit Google verbunden und wird nicht von Google unterstützt.

Ihr Feedback ist uns wichtig!

Vielen Dank, dass Sie TableTorch verwenden oder in Betracht ziehen!

Beschreibt diese Seite die Funktion korrekt und verständlich? Funktioniert sie tatsächlich so, wie hier beschrieben, oder gibt es ein Problem? Haben Sie Verbesserungsvorschläge?

Bei Fragen können Sie sich jederzeit gerne an uns wenden.