Kdy použít výdrž?

Kdy použít výdrž?
Kdy použít výdrž?
Anonim

Co je to Holdout Set? Někdy označovaná jako „testovací“data, podmnožina pozastavení poskytuje konečný odhad výkonu modelu strojového učení poté, co byl trénován a ověřen. Sady výdrže by se nikdy neměly používat k rozhodování o tom, které algoritmy použít, ani ke zlepšování či ladění algoritmů.

Je křížové ověření lepší než vyčkávání?

Křížová validace je obvykle preferovanou metodou, protože dává vašemu modelu příležitost trénovat na několika dílčích testech vlaku. To vám dává lepší představu o tom, jak dobře bude váš model fungovat na neviditelných datech. Na druhé straně výdrž závisí pouze na jednom rozdělení vlakového testu.

Co je to udržovací přístup?

Metoda Holdout je nejjednodušší způsob vyhodnocení klasifikátoru. V této metodě je datová sada (sbírka datových položek nebo příkladů) rozdělena do dvou sad, nazvaných tréninková sada a testovací sada. Klasifikátor provádí funkci přiřazování datových položek v dané kolekci k cílové kategorii nebo třídě.

Mám vždy provádět křížovou validaci?

Obecně je křížová validace potřebná vždy, když potřebujete určit optimální parametry modelu, pro logistickou regresi by to byl parametr C.

Jaká je výhoda křížové validace K-fold?

pokud porovnáte testovací MSE jsou lepší v případě k-násobného CV než LOOCV. K-násobek CV nebo jakékoli CV nebo metody převzorkování nezlepšit chyby testů. odhadují chyby testu. v případě k-foldu to dělá lepší práci při odhadu chyby než LOOCV.

Doporučuje: