Cenzorovaná data
Při analýze je nutné zvážit všechna data, i když některá z nich mohou do souboru
vnášet dodatečnou nejistotu. Jsou to tak zvaná cenzorovaná data, reprezentující zvláště na dolním konci rozsahu hodnoty
způsobené dolní hranicí detekce LOD (Limit of Detection) - data cenzorovaná zleva.
To může být vážný problém dat životního prostředí v případě hodnot kontaminací, kdy hodnoty koncentrací se
pohybují na mezním rozsahu měřitelnosti. Pojďme se podívat na případ kontaminace látkou TCDD.
Předpokládejme 106 hodnot koncentrace 2378TCDD z nichž 93 jsou LOD hodnoty. Pak můžeme na prvním obrázku porovnat tři distribuční křivky:
černá představuje všech 106 vzorků jako validní hodnoty, modrá vyjadřuje distribuci pouze 13 skutečně validních hodnot
a červená bere 93 hodnot jako cenzorování zleva. To je porovnání skutečně mezního případu, aby bylo vidět, jak odlišné mohou být jednotlivé případy.
Na druhém obrázku je běžnější případ poměru validních a LOD hodnot, ale i tady můžeme porovnat, jak se změní rozdělení pravděpodobnosti, když započítáme LOD hodnoty.