Švarinimas – tai duomenų valymas, pašalinant klaidas, neatitikimus ar nereikalingą informaciją, kad jie taptų tikslūs, vientisi ir tinkami analizei.
Pagrindiniai veiksmai:
- Trūkstamų reikšmių tvarkymas.
- Dublikatų šalinimas.
- Formatavimo neatitikimų taisymas (pvz., datos, vienetai).
- Netikslumų ar akivaizdžių klaidų korekcija.
Pavyzdžiai:
1. Adresų lentelėje:
Pvz., „Vilnius, Gedimino pr. 1“ ir „Vilnius, Gedimino prospektas 1“ suvienodinama į vieną formatą.
2. Klientų duomenys:
Pašalinami pasikartojantys įrašai apie tą patį asmenį.
3. Apklausos rezultatai:
Išmetami neužbaigti arba absurdiški atsakymai (pvz., amžius „150 metų“).
Tikslas: Pagerinti duomenų kokybę, patikimumą ir naudingumą tolesniam naudojimui.
Jūsų pataisymai bus išsiųsti moderatorių peržiūrai, jei informacija tikslesnė/taisyklingesnė
ji bus patalpinta vietoj esamos.