Takže, nemělo by záležet na tom, zda zamícháte testovací nebo ověřovací data nebo ne (pokud nepočítáte nějakou metriku, která závisí na pořadí vzorků), vzhledem k tomu, že nebudete počítat žádný gradient, ale jen ztrátu nebo nějakou metriku/míru, jako je přesnost, která není citlivá na pořadí …
Proč by měla být data při křížové validaci zamíchána?
it pomáhá tréninku rychle konvergovat . zabraňuje jakémukoli zkreslení během školení. zabraňuje to modelu naučit se pořadí tréninku.
Mohu zamíchat sadu ověření?
Model je nejprve trénován na A a B kombinovaných jako trénovací sada a vyhodnocen na ověřovací sadě C. … Křížová validace funguje pouze ve stejných případech, kdy můžete náhodně zamíchat svá data a vybrat si ověřovací sadu.
K čemu se používá míchání dat?
Přehazování dat. Jednoduše řečeno, techniky míchání mají za cíl smíchat data a volitelně mohou zachovat logické vztahy mezi sloupci. Náhodně zamíchá data z datové sady v rámci atributu (např. sloupec v čistě plochém formátu) nebo množiny atributů (např. sada sloupců).
Záleží na pořadí dat ve strojovém učení?
Záleží na pořadí trénovacích dat při trénování neuronových sítí? - Quora. Je nesmírně důležité trénovací data zamíchat, abyste nezískali celé minidávky vysoce korelovaných příkladů. Dokuddata byla zamíchána, vše by mělo fungovat OK.