Datarensning

Datarensning ( eng.  Datarensning ) er processen med at identificere og rette fejl, datainkonsistens for at forbedre deres kvalitet, nogle gange klassificeret som en integreret del af datamining .

Datarensning udføres på specifikke datasæt i databaser eller filer. Behovet for datarensning opstår oftest ved integration af forskellige informationssystemer ( datavarehuse , virksomhedsressourcestyringssystemer, systemer til administration af kunderelationer ).

Datakilder i forskellige systemer er ofte spredte og i forskellige tilstande. Transformationer udføres automatisk (i henhold til et sæt regler) eller manuelt (interaktivt).

De mest typiske emneområder, der skal renses og rettes i virksomhedens informationssystemer, er oplysninger om enkeltpersoner og organisationer, adresse- og kontaktoplysninger, ligesom eventuelle referenceoplysninger, der indtastes manuelt i tekstform, også skal renses.

Links