Random forest regresija

Random forest regresija izveido modeli, kas izmanto lēmumu koku ansambli, lai novērtētu nepārtrauktu mainīgo.

Video zemāk parāda, kā izmantot TableTorch, lai pielietotu random forest regresijas algoritmu. Tas ļauj izveidot lietota automobiļa cenas modeli tieši Google izklājlapā.

Skatīties YouTube: Random forest regresija Google izklājlapā ar TableTorch (video angļu valodā) 5:56

TableTorch atbalsta vairākas opcijas random forest modeļiem:

  • lēmumu koku skaits;
  • viena koka maksimālais dziļums;
  • maksimālais pazīmju skaits katram kokam;
  • pazīmju izvēle ar nomaiņu (t.i., vienas un tās pašas pazīmes izmantošana vairākas reizes vienā kokā).

Regresijas uzdevumiem TableTorch atbalsta:

  • Prognožu kolonnas ievietošanu.
  • Apmācības kopsavilkuma lapas pievienošanu, kas satur:
    • apmācības opcijas;
    • vispārējos modeļa kvalitātes rādītājus:
      • vidējo kvadrātisko kļūdu;
      • vidējo absolūto kļūdu;
      • vidējo absolūto procentuālo kļūdu;
      • mediānas absolūto kļūdu;
      • mediānas absolūto procentuālo kļūdu;
      • R²;
      • neizskaidrotās variācijas daļu;
    • pirmo 50 koku pārskatu, izskaidrojot if-else nosacījumus kokos.

Prognožu kolonnas satur formulas, kas gatavas izmantošanai jauniem datiem.

Sāciet darbu ar TableTorch

  1. Instalējiet TableTorch Google izklājlapām, izmantojot Google Workspace Marketplace. Vairāk informācijas par sākotnējo iestatīšanu.
  2. Noklikšķiniet uz TableTorch ikonas Google izklājlapu labās puses panelī.

TableTorch ikona Google izklājlapu labās puses panelī

Random forest opcijas

Random forest ir ansambļa modelis, kas izveido vairākus lēmumu kokus. Katrs koks tiek apmācīts uz ierobežota pazīmju skaita. Tā apmācības opciju mainīšana var palīdzēt izveidot precīzāku un noturīgāku modeli.

Lēmumu koku skaits

Līdz noteiktam limītam, jo lielāks ir šis skaitlis, jo mazāka ir prognožu variācija, t.i., tās kļūst stabilākas un samazinās pārmērīgas pielāgošanās risks.

Viena koka maksimālais dziļums

Jo lielāks ir šis skaitlis, jo dziļāki random forest rezultējošie koki var kļūt. Tas var uzlabot modeļa precizitāti, tomēr tas var arī izraisīt pārāk lielu pielāgošanos datiem, īpaši, ja trenēšanas datu kopa nav ļoti liela.

Maksimālais pazīmju skaits katram kokam

Nosaka, cik daudz pazīmju no avota datu kopas katrs koks var izmantot apmācībai. Šī skaitļa palielināšana, visticamāk, radīs precīzāku modeli, bet var arī izraisīt lielāku variāciju un lielāku pārāk lielas pielāgošanās iespēju, īpaši, ja nepietiek datu.

Pazīmju izvēle ar nomaiņu

Šīs opcijas iespējošana ļauj pazīmēm parādīties vairāk nekā vienu reizi datu kopas izlasēs, kas tiek izmantotas konkrētu koku apmācībai. Tas var samazināt prognožu variāciju.

Skatīt arī:

Google, Google Izklājlapas, Google Workspace un YouTube ir Google LLC preču zīmes. Gaujasoft TableTorch nav saistīts ar Google un to neveicina Google.

Pasakiet mums!

Paldies, ka izmantojat vai apsverot izmantot TableTorch!

Vai šī lapa precīzi un atbilstoši apraksta attiecīgo funkciju? Vai tā patiešām darbojas tā, kā šeit izskaidrots, vai arī ir kāda problēma? Vai jums ir kādi ieteikumi, kā mēs varētu uzlaboties?

Lūdzu, paziņojiet mums, ja jums ir kādi jautājumi.