Hledání alternativní cesty
Následující stránky jsou zaměřeny na nový způsob získávání
informací z datových souborů. Získaná data potřebujeme většinou analyzovat a na tento proces jsou k dispozici různé
metody, většinou založené na matematické statistice. V této oblasti si můžeme položit několik otázek. Jaká data jsou
vhodná pro analýzu? Jaké informace chceme získat? Proč nepoužijeme nějakého nového způsobu? Zde se pokusíme na tyto
otázky odpovědět. Při zpracovávání dat se můžeme potkat s různými a někdy zcela zásadními problémy standardního
statistického paradigmatu, zvláště při analýze dat o stavu životního prostředí, v lékařském výzkumu
ale i v průmyslové výrobě.
Pokusme se vysvětlit důvody nutnosti použít alternativní analýzy
dat. Hlavní důvody jsou:
a) centrální limitní věta není splněna v případě malých datových souborů
b) data nemají normální distribuci pravděpodobnosti
Pro naměřené hodnoty v oblasti životního prostředí, existují značná omezení, hlavně v počtu naměřených hodnot, odlišností od normálního rozdělení a homogenity dat. Jsou nevhodná pro použití standardních statistických postupů. Z důvodů velké neurčitosti dat způsobené velkým rozptylem, nehomogenitou, zkrátka velkými chybami v datech, nedostaneme spolehlivé výsledky. Na obrázku je příklad (měření kontaminace DDT ve vodách českých řek) jak vypadá skutečné rozdělení pravděpodobnosti malého souboru dat s velkou neurčitostí.
a) centrální limitní věta není splněna v případě malých datových souborů
b) data nemají normální distribuci pravděpodobnosti
Pro naměřené hodnoty v oblasti životního prostředí, existují značná omezení, hlavně v počtu naměřených hodnot, odlišností od normálního rozdělení a homogenity dat. Jsou nevhodná pro použití standardních statistických postupů. Z důvodů velké neurčitosti dat způsobené velkým rozptylem, nehomogenitou, zkrátka velkými chybami v datech, nedostaneme spolehlivé výsledky. Na obrázku je příklad (měření kontaminace DDT ve vodách českých řek) jak vypadá skutečné rozdělení pravděpodobnosti malého souboru dat s velkou neurčitostí.
Alternativní metody analýzy.
Tyto alternativní robustní metody jsou založeny na teorii
Mathematical Gnostic Theory of uncertain data
(MGT) a představují zcela nový pohled na datové analýzy. MGT je nestatistická teorie neurčitosti dat.
Přesto, že je založena na jiných matematických aparátech než klasická statistika, dává v případě platnosti statistických předpokladů
identické výsledky se statistickými postupy.