Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Výstavba regresního modelu diagnostikami regresního tripletu
Autoři: Meloun Milan
Rok: 2014
Druh publikace: článek ve sborníku
Název zdroje: Analýza dat 2014
Název nakladatele: TriloByte Statistical Software, spol. s r. o.
Místo vydání: Pardubice
Strana od-do: 43-56
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Výstavba regresního modelu diagnostikami regresního tripletu Postup hledání regresního modelu obsahuje: 1. Návrh modelu začíná vždy od nejjednoduššího modelu, a to lineárního. 2. Předběžná analýza dat sleduje proměnlivost proměnných na rozptylových diagramech a indexových grafech. Vyšetřuje se multikolinearita, heteroskedasticita, autokorelace a vlivné body. 3. Odhadování parametrů se provádí klasickou metodou nejmenších čtverců, následované testem významnosti parametrů Studentovým t-testem. Střední kvadratická chyba predikce MEP a Akaikovo informační kritérium AIC představují rozhodčí kritéria při hledání nejlepšího regresního modelu. 4. Regresní diagnostika provádí identifikaci vlivných bodů a ověření předpokladů metody nejmenších čtverců. V případě více vysvětlujících proměnných se posoudí vhodnost jednotlivých proměnných pomoci parciálních regresních grafů a parciálních reziduálních grafů. 5. Parametry zpřesněného modelu jsou odhadovány s využitím (a) metody vážených nejmenších čtverců (MVNČ) při nekonstantnosti rozptylu, (b) metody zobecněných nejmenších čtverců (MZNČ) při autokorelaci, (c) metody podmínkových nejmenších čtverců (MPNČ) při omezení kladených na parametry, (d) metody racionálních hodností (RH) u multikolinearity, (e) metody rozšířených nejmenších čtverců (MRNČ) pro případ, že všechny proměnné jsou zatížené náhodnými chybami, a konečně (f) robustních metod pro jiná rozdělení než normální a data s vybočujícími hodnotami a extrémy. Regresní triplet; outlier; extrém; racionální hodnost; multikolinearita
eng Regression model building with the use of regression diagnostics To find the regression model includes: 1. The model always starts from the simplest model, not linear. 2. The preliminary analysis of the data follows the variability of variables to scatter charts and index charts. Investigates the multicollinearity, heteroscedasticity, autocorrelation and influential points. 3. The estimated parameters is done by a classical least squares method, followed by a test of significance of parameters by Student's t-test. Mean square error of prediction MEP and Akaikovo information criterion AIC represent the referee criteria in finding the best regression model. 4th Regression diagnostics is identifying influential points and verify assumptions, the least squares method. For more explanatory variables to examine the suitability of individual variables help of partial regression graphs and partial residual graphs. 5. The parameters to an updated model are estimated using (a) the method of weighted least squares (MVNČ) at nekonstantnosti scattering, (b) the method of generalized least squares (MZNČ) with autocorrelation, (c) the method of conditional least squares (MPNČ) when restrictions on the parameters (d) methods of rational ranks (RH) for multicollinearity, (e) methods for the extended least squares (gurgle) for the case that all variables are loaded with random errors, and finally (f) robust methods for different distribution than normal and data with vybočujícími values ​​and extremes. Regression triplet; outlier; extreme; rational rank; multicollinearity;