Random Forest Klassifikation

Random Forest Klassifikation passt ein Modell an, das anhand der Merkmale einer Zeile eine Klasse vorhersagt.

TableTorch unterstützt mehrere Optionen für Random Forest Modelle:

  • Anzahl der Entscheidungsbäume;
  • maximale Tiefe eines einzelnen Baums;
  • maximale Anzahl der Merkmale pro Baum;
  • Merkmalsauswahl mit Ersetzung (d.h. dasselbe Merkmal kann mehrfach in der Stichprobe eines Baums vorkommen).

Für Klassifikationsaufgaben unterstützt TableTorch:

  • Einfügen einer Klassenvorhersagespalte.
  • Einfügen einer Wahrscheinlichkeitsvorhersagespalte für eine bestimmte Klasse.
  • Hinzufügen eines Lernzusammenfassungsblatts, das Folgendes enthält:
    • Lernoptionen;
    • allgemeine Modellqualitätsmetriken (Genauigkeit, durchschnittliche sowie mediane Sensitivität und Präzision);
    • Modellqualitätsmetriken pro Klasse (Sensitivität, Präzision, F₁);
    • Übersicht der ersten 50 Bäume mit Erläuterung der If-Else-Bedingungen innerhalb der Bäume.

Vorhersagespalten enthalten Formeln, die sich unmittelbar auf neue Daten anwenden lassen.

Erste Schritte mit TableTorch

  1. Installieren Sie TableTorch für Google Tabellen über den Google Workspace Marketplace. Weitere Informationen zur Ersteinrichtung.
  2. Klicken Sie auf das TableTorch-Symbol im rechten Seitenbereich von Google Tabellen.

TableTorch-Symbol im rechten Seitenbereich von Google Tabellen

Random Forest Optionen

Random Forest ist ein Ensemble-Modell, das mehrere Entscheidungsbäume erstellt. Jeder Baum wird mit einer begrenzten Anzahl von Merkmalen trainiert. Das Ändern der Trainingsoptionen kann helfen, ein genaueres und robusteres Modell zu erstellen.

Anzahl der Entscheidungsbäume

Bis zu einer gewissen Grenze gilt: Je höher dieser Wert, desto geringer ist die Varianz der Vorhersagen, d.h. sie werden stabiler und das Modell neigt weniger zur Überanpassung.

Maximale Tiefe eines einzelnen Baums

Je höher dieser Wert, desto tiefer können die einzelnen Bäume des Random Forest wachsen. Das kann die Modellgenauigkeit verbessern, birgt aber auch das Risiko einer Überanpassung, insbesondere wenn der Trainingsdatensatz nicht sehr groß ist.

Maximale Anzahl der Merkmale pro Baum

Legt fest, wie viele Merkmale aus dem Quelldatensatz jedem Baum für das Training zur Verfügung stehen. Ein höherer Wert führt in der Regel zu einem genaueren Modell, kann aber auch zu höherer Varianz und größerer Überanpassungsgefahr führen, insbesondere bei zu kleinem Datensatz.

Merkmalsauswahl mit Ersetzung

Wenn diese Option aktiviert ist, können Merkmale mehrfach in den Stichproben vorkommen, die zum Training der einzelnen Bäume verwendet werden. Das kann die Varianz der Vorhersagen reduzieren.

Siehe auch:

Google, Google Tabellen, Google Workspace und YouTube sind Marken von Google LLC. Gaujasoft TableTorch ist nicht mit Google verbunden und wird nicht von Google unterstützt.

Ihr Feedback ist uns wichtig!

Vielen Dank, dass Sie TableTorch verwenden oder in Betracht ziehen!

Beschreibt diese Seite die Funktion korrekt und verständlich? Funktioniert sie tatsächlich so, wie hier beschrieben, oder gibt es ein Problem? Haben Sie Verbesserungsvorschläge?

Bei Fragen können Sie sich jederzeit gerne an uns wenden.