Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Usefull Diagnostics of Exploratory Data Analysis in the Rigorous Data Treatment
Autoři: Meloun Milan
Rok: 2016
Druh publikace: ostatní - konference, koncert
Název nakladatele: 2 THETA ASE, s.r.o. ,Jasná 307, 737 01 Český Těšín
Strana od-do: nestránkováno
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Užitečné diagnostiky exploratorní analýzy v rigorozní analýze laboratorních dat Užitečné diagnostiky exploratorní analýzy v rigorozní analýze laboratorních dat Užitečné diagnostiky exploratorní analýzy v rigorozní analýze laboratorních dat V prvním kroku se v průzkumové (exploratorní) analýze dat vyšetřují statistické zvláštnosti, jako je lokální koncentrace dat, tvarové zvláštnosti rozdělení dat a přítomnosti podezřelých hodnot. Odhalí se tak anomálie a odchylky rozdělení výběru od předpokládaného rozdělení Gaussova. Interaktivní statistická analýza na počítači tento postup ulehčuje, většina statistického software totiž nabízí řadu diagnostických grafů a diagramů. V druhém kroku se ověří základní předpoklady, kladené na výběr, jako jsou nezávislost prvků, homogenita výběru, dostatečný rozsah výběru a rozdělení výběru. Jsou-li závěry tohoto kroku optimistické, následuje vyčíslení klasických odhadů polohy a rozptýlení, tj. aritmetického průměru a rozptylu v kroku čtvrtém. Sem patří i konstrukce intervalů spolehlivosti a případně testování hypotéz. V opačném případě následuje pokus o třetí krok, obsahující symetrizující transformaci dat. Ve třetím kroku se provádí mocninná a Boxova- Coxova transformace, které mohou vést k symetričtějšímu rozdělení výběru a umožňují provedení korektnějšího odhadu polohy a rozptýlení. Transformace je vhodná především při nekontantnosti rozptylu a při asymetrii rozdělení původních dat. Ve čtvrtém kroku se v konfirmatorní analýze nabízí paleta rozličných odhadů polohy, rozptýlení a tvaru, jež lze rozdělit do skupin: klasické odhady a robustní odhady (necitlivé na odlehlé prvky výběru, resp. další předpoklady o datech). Z nabídky odhadů parametrů vybírá uživatel uvážlivě ty, jež mají statistický smysl a odpovídají závěrům průzkumové analýzy dat a závěrům ověření předpokladů o výběru. Užitečné diagnostiky; exploratorní analýza; rigorozní analýza; laboratorní data;
eng Usefull Diagnostics of Exploratory Data Analysis in the Rigorous Data Treatment The first step of univariate data analysis called an exploratory data analysis (EDA) isolates certain basic statistical features and patterns of data. EDA is based on the general assumptions as a continuity and differentiability of underlying density. For visualization of data the quantile plot, the dot and jittered dot diagrams, and the box-and-whisker plot are proposed. Peculiarities of sample distribution are investigated by the midsum plot, the symmetry plot, the curtosis plot, and the quantile-box plot. Construction of sample probability density function is carried out by the kernel estimation and the histogram. The quantile-quantile plot serves for comparison of sample distribution with selected theoretical ones. No chemist can be unaware of the astonishing developments that have recently taken place in the realm of microelectronics. The rapid growth of chemometrics — the application of the mathematical methods to the solution of chemical problems of all types — is due to the ease with which large quantities of data can be handled, and complex calculations done, with calculators and computers. It is most important for the analytical chemist to remember that the availability of computer-assisted data handling facilities increases rather than decreases the need for a sound knowledge of the principles underlying statistical calculations. A computer will rapidly perform such calculations, whatever the data inserted. In this paper we want to introduce some useful methods and new software of statistical data treatment which should bring benefits to every chemist. Exploratory data analysis (EDA) provides the first contact with the data and serves to isolate certain basic statistical features and patterns of data. According to Tukey the EDA is a "detective work". It uses various descriptive and graphically oriented techniques which are typically free of strict statistical assumptions about data. These techniques are often called "distribution-free". Usefull Diagnostics; Exploratory Data Analysis; Rigorous Data Treatment;