Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Best practices and tools in R and Python for statistical processing and visualization of lipidomics and metabolomics data
Autoři: Idkowiak Jakub | Dehairs Jonas | Schwarzerová Jana | Olesová Dominika | Truong Jacob X. M. | Kvasnička Aleš | Eftychiou Marios | Cools Ruben | Spotbeen Xander | Jirásko Robert | Veseli Vulnet | Giampa Marco | de Laat Vincent | Butler Lisa M. | (Weckwerth Wolfram | Friedecký David | Demeulemeester Jonas | Hron Karel | Swinnen Johennes V. | Holčapek Michal
Rok: 2025
Druh publikace: článek v odborném periodiku
Název zdroje: Nature Communications
Strana od-do: 09/2025
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Osvědčené postupy a nástroje v R a Pythonu pro statistické zpracování a vizualizaci lipidomických a metabolomických dat. Hmotnostně spektrometrická lipidomika a metabolomika generují rozsáhlé datové soubory, které – spolu s metadaty, jako jsou klinické parametry – vyžadují specifické dovednosti v oblasti explorativní analýzy dat, aby bylo možné identifikovat a vizualizovat statisticky významné trendy a biologicky relevantní rozdíly. Kromě specializovaných metod vyvinutých jednotlivými laboratořemi existuje solidní základ volně dostupných nástrojů pro explorativní analýzu dat a vizualizaci, který zde shrnujeme. Patří sem příprava deskriptivních statistik, anotované boxploty, testování hypotéz, volcano ploty, lipidové mapy a grafy acylových řetězců mastných kyselin, nesupervidované i supervidované metody redukce dimenzionality, dendrogramy a heatmapy. Tato přehledová práce je určena těm, kteří si chtějí rozvíjet dovednosti v analýze a vizualizaci dat pomocí volně dostupných řešení v R nebo Pythonu. Začátečníci jsou provázeni výběrem knihoven v R a Pythonu pro tvorbu grafů připravených k publikaci, aniž by byli zahlceni složitostí kódu. Tento rukopis spolu s přidruženým GitBook repozitářem obsahujícím podrobné instrukce poskytuje čtenářům komplexního průvodce a podporuje využívání R a Pythonu pro robustní a reprodukovatelnou chemometrickou analýzu omických dat. CHYBĚJÍCÍ HODNOTA IMPUTACE; DATA HMOTNOSTNÍ SPEKTROMETRIE; NORMALIZACE; UNIVARIÁTNÍ IDENTIFIKACE; SOUHRN; ONEMOCNĚNÍ, MODELY; LIPIDY; XCMS
eng Best practices and tools in R and Python for statistical processing and visualization of lipidomics and metabolomics data Mass spectrometry-based lipidomics and metabolomics generate extensive data sets that, along with metadata such as clinical parameters, require specific data exploration skills to identify and visualize statistically significant trends and biologically relevant differences. Besides tailored methods developed by individual labs, a solid core of freely accessible tools exists for exploratory data analysis and visualization, which we have compiled here, including preparation of descriptive statistics, annotated box plots, hypothesis testing, volcano plots, lipid maps and fatty acyl chain plots, unsupervised and supervised dimensionality reduction, dendrograms, and heat maps. This review is intended for those who would like to develop their skills in data analysis and visualization using freely available R or Python solutions. Beginners are guided through a selection of R and Python libraries for producing publication-ready graphics without being overwhelmed by the code complexity. This manuscript, along with associated GitBook code repository containing step-by-step instructions, offers readers a comprehensive guide, encouraging the application of R and Python for robust and reproducible chemometric analysis of omics data. MISSING VALUE IMPUTATION; MASS-SPECTROMETRY DATA; NORMALIZATION; UNIVARIATE IDENTIFICATION; PACKAGE; DISEASE, MODELS; LIPIDS; XCMS