Random Forest Regression

Random Forest Regression passt ein Modell an, das auf einem Ensemble von Entscheidungsbäumen basiert, um eine kontinuierliche Variable zu schätzen.

Das Video (auf Englisch) unten zeigt, wie Sie mit TableTorch den Random-Forest-Regressionsalgorithmus anwenden können, um direkt in Google Tabellen ein Modell zur Schätzung des Preises eines Gebrauchtwagens anzupassen.

Auf YouTube ansehen: Random Forest Regression in Google Tabellen mit TableTorch (Video auf Englisch) 5:56

TableTorch unterstützt mehrere Optionen für Random Forest Modelle:

  • Anzahl der Entscheidungsbäume;
  • maximale Tiefe eines einzelnen Baums;
  • maximale Anzahl der Merkmale pro Baum;
  • Merkmalsauswahl mit Ersetzung (d.h. dasselbe Merkmal kann mehrfach in der Stichprobe eines Baums vorkommen).

Für Regressionsaufgaben unterstützt TableTorch:

  • Einfügen einer Vorhersagespalte.
  • Hinzufügen eines Lernzusammenfassungsblatts, das Folgendes enthält:
    • Lernoptionen;
    • allgemeine Modellqualitätsmetriken:
      • Wurzel des mittleren quadratischen Fehlers (Root Mean Squared Error, RMSE);
      • mittlerer absoluter Fehler (Mean Absolute Error, MAE);
      • mittlerer absoluter prozentualer Fehler (Mean Absolute Percentage Error);
      • medianer absoluter Fehler (Median Absolute Error);
      • medianer absoluter prozentualer Fehler (Median Absolute Percentage Error);
      • R²;
      • Anteil der unerklärten Varianz;
    • Übersicht der ersten 50 Bäume mit Erläuterung der If-Else-Bedingungen innerhalb der Bäume.

Vorhersagespalten enthalten Formeln, die sich unmittelbar auf neue Daten anwenden lassen.

Erste Schritte mit TableTorch

  1. Installieren Sie TableTorch für Google Tabellen über den Google Workspace Marketplace. Weitere Informationen zur Ersteinrichtung.
  2. Klicken Sie auf das TableTorch-Symbol im rechten Seitenbereich von Google Tabellen.

TableTorch-Symbol im rechten Seitenbereich von Google Tabellen

Random Forest Optionen

Random Forest ist ein Ensemble-Modell, das mehrere Entscheidungsbäume erstellt. Jeder Baum wird mit einer begrenzten Anzahl von Merkmalen trainiert. Das Ändern der Trainingsoptionen kann helfen, ein genaueres und robusteres Modell zu erstellen.

Anzahl der Entscheidungsbäume

Bis zu einer gewissen Grenze gilt: Je höher dieser Wert, desto geringer ist die Varianz der Vorhersagen, d.h. sie werden stabiler und das Modell neigt weniger zur Überanpassung.

Maximale Tiefe eines einzelnen Baums

Je höher dieser Wert, desto tiefer können die einzelnen Bäume des Random Forest wachsen. Das kann die Modellgenauigkeit verbessern, birgt aber auch das Risiko einer Überanpassung, insbesondere wenn der Trainingsdatensatz nicht sehr groß ist.

Maximale Anzahl der Merkmale pro Baum

Legt fest, wie viele Merkmale aus dem Quelldatensatz jedem Baum für das Training zur Verfügung stehen. Ein höherer Wert führt in der Regel zu einem genaueren Modell, kann aber auch zu höherer Varianz und größerer Überanpassungsgefahr führen, insbesondere bei zu kleinem Datensatz.

Merkmalsauswahl mit Ersetzung

Wenn diese Option aktiviert ist, können Merkmale mehrfach in den Stichproben vorkommen, die zum Training der einzelnen Bäume verwendet werden. Das kann die Varianz der Vorhersagen reduzieren.

Siehe auch:

Google, Google Tabellen, Google Workspace und YouTube sind Marken von Google LLC. Gaujasoft TableTorch ist nicht mit Google verbunden und wird nicht von Google unterstützt.

Ihr Feedback ist uns wichtig!

Vielen Dank, dass Sie TableTorch verwenden oder in Betracht ziehen!

Beschreibt diese Seite die Funktion korrekt und verständlich? Funktioniert sie tatsächlich so, wie hier beschrieben, oder gibt es ein Problem? Haben Sie Verbesserungsvorschläge?

Bei Fragen können Sie sich jederzeit gerne an uns wenden.