Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Vícerozměrná statistická analýza povodní na řece Sázavě v období 1961 - 2000
Autoři: Meloun Milan
Rok: 2007
Druh publikace: článek v odborném periodiku
Název zdroje: Vodní hospodářství
Název nakladatele: Vodní hospodářství, spol. s r.o.,
Místo vydání: Praha
Strana od-do: 419-423
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Vícerozměrná statistická analýza povodní na řece Sázavě v období 1961 - 2000 Vícerozměrná statistická analýza je založena na latentních proměnných, které jsou lineární kombinací původních. Zdrojová matice dat obsahuje kvalitativní znaky v 13 sloupcích a sledované povodně jako objekty v 25 řádcích zdrojové matice dat. Cílem analýzy dat je nalézt shluk podobných si povodní a podobných znaků, jež povodně popisují. Podobnost povodní je posuzována na základě jistých podobností či vzdálenosti povodní v 13-rozměrném prostoru všech znaků dle kritéria, že čím je Mahalonobisova vzdálenost shluků povodní větší, tím menší je jejich vzájemná podobnost. Strukturu a vazby mezi sledovanými znaky vystihují metody snížení dimensionality. Rozptylový diagram skóre zobrazuje objekty, rozptýlené v rovině prvních dvou hlavních komponent (PCA) či faktorů (FA). Graf komponentních vah porovnává vzdálenosti (podobnosti) mezi znaky, kde krátká vzdálenost značí silnou korelaci dvou znaků. Znaky ale také povodně lze seskupovat do shluků hierarchicky, a to dle předem zvoleného způsobu metriky a výsledkem je dendrogram. Původních 13 sledovaných znaků lze zredukovat ve tři latentní proměnné, faktory nebo hlavní komponenty. Do nejvýznamnějšího faktoru FA1 se promítnou srážkové ukazatele a tání sněhu, druhý faktor FA2 souvisí se strmostí povodňové vlny a průtokem před povodní. Vysvětlený rozptyl v datech v prostoru tří nalezených faktorů je necelých 60 %, což znamená, že více než 40 % variability v datech bylo vyhodnoceno jako šum. Důvodem vysoké hodnoty šumu je jednak charakter dat, kdy povodňové stavy jsou sami o sobě extrémními případy, a jednak malý počet sledovaných povodní ku poměrně velkému počtu kvalitativních znaků. Optimum bývá totiž a nebo by mělo i zde být okolo 20 objektů na 1 sledovaný znak, a proto minimální poměr by měl být 5 povodní na 1 znak. PCA, FA, CA, CM, Cattelův graf, Shluková analýza, Dendrogram, Povodně, Sázava.
eng Multivariate Statistical Analysis of Floods on the River Sázava within 1961 - 2000 Multivariate statistical analysis is based on the latent variables which are formed as the linear combination of original variables. The source data matrix contains here objects in 25 rows (floods) and variables (properties of floods) in 13 columns. Before data treatment the data are scaled. Similarity of objects and variables is considered on base on Mahalanobis distance in the 13-dimensional space. The principal components analysis PCA reduces dimensionality and presents floods in two or three dimensions. The plot of components weight shows hidden structure among variables while the scatterplot shows the hidden structure of objects. The cluster analysis leads to clusters which may be plotted in dendrogram. There are two dendrograms available, the dendrogram of variables properties) and the dendrogram of objects (floods). PCA, FA, CA, CM, Cluster Analysis, Dendrogram, Cattel´s index diagram