Krustytis – tai lietuviškas terminas, reiškiantis kryžminį testavimą (angl. cross-validation), dažniausiai vartojamas duomenų moksle ir mašininiame mokyme.
Reikšmė:
Tai metodas, vertinantis modelio tikslumą, padalijant duomenis į dalis: viena dalis naudojama modeliui mokyti, kita – testuoti. Procesas kartojamas kelis kartus su skirtingomis duomenų dalimis, kad būtų sumažinta atsitiktinė klaida.
Pavyzdžiai:
1. 5 dalijų krustytis – duomenys skirstomi į 5 lygias grupes. Modelis mokomas 4 grupėse, testuojamas 1 grupėje. Kartojama 5 kartus.
2. Stratifikuotas krustytis – naudingas, kai duomenys nesubalansuoti (pvz., reti įvykiai). Kiekvienoje dalyje išlaikomas klasių proporcingumas.
3. Laiko eilučių krustytis – naudojamas prognozavimui, kai svarbi laiko tvarka. Mokymo duomenys visada imami iš ankstesnių laikotarpių nei testavimo.
Praktinis pritaikymas:
python
from sklearn.model_selection import cross_val_score
Įvertinamas modelis naudojant 5 dalijų krustytį
scores = cross_val_score(modelas, X, y, cv=5)
Trumpai: Krustytis padidina patikimumą, įvertinant modelio gebėjimą generalizuoti naujiems duomenims.
Jūsų pataisymai bus išsiųsti moderatorių peržiūrai, jei informacija tikslesnė/taisyklingesnė
ji bus patalpinta vietoj esamos.