High-dimensional data Dotaz Zobrazit nápovědu
Závěrečná zpráva o řešení grantu Agentury pro zdravotnický výzkum MZ ČR
nestr.
The recent technological advances enabled the biomedical research to explore the underlying biological processes of the living organisms at various resolutions and from different perspectives. While the amount of produced data grew dramatically over the years, the pace at which our knowledge lagged behind - an indication of inability of the current computational tools to extract knowledge from the large pool of noisy data. NEUROMINER will provide a framework for machine learning and data mining, with a special emphasis on neuroscience research. The project has three main axes of research, each corresponding to a currently unmet need: (1) extraction and selection of features with strong discrimination properties, (2) systems able to learn from high-dimensional data and not suffering from overfitting problems, and (3) rigorous statistical model assessment procedure. The applicants are experts in medical image processing and analysis, biostatistics and machine learning.
Nedávné technologické pokroky biomedicínského výzkumu umožnily zkoumat základní biologické procesy v živých organismech při různých rozlišeních a z různých úhlů pohledu. Zatímco množství produkovaných dat v průběhu let dramaticky roste, tempo našich získávaných znalostí spíše zaostává, což ukazuje na neschopnost současných výpočetních nástrojů umožnit extrakci znalostí z velkého množství zašuměných dat. NEUROMINER poskytne rámec pro strojové učení a dolování z obrazových dat se zvláštním důrazem na neurovědní výzkum. Tři hlavní osy projektu odpovídají problémům, pro které v současné době není známo řešení: (1) extrakce a selekce příznaků se silnou diskriminačních schopností z mnohorozměrných dat, (2) nepřeučené systémy učící se z mnohorozměrných dat (3) rigorózní postup pro statistické validace modelů. Navrhovatelé projektu jsou experty ve zpracování analýze medicínských obrazů, biostatistice a strojovém učení.
- MeSH
- biostatistika MeSH
- data mining MeSH
- mozek diagnostické zobrazování MeSH
- neuronové sítě MeSH
- neurozobrazování MeSH
- počítačové zpracování obrazu MeSH
- reprodukovatelnost výsledků MeSH
- schizofrenie diagnostické zobrazování MeSH
- strojové učení MeSH
- Konspekt
- Patologie. Klinická medicína
- NLK Obory
- neurologie
- radiologie, nukleární medicína a zobrazovací metody
- lékařská informatika
- NLK Publikační typ
- závěrečné zprávy o řešení grantu AZV MZ ČR
376 stran
Cover -- Half Title -- Title Page -- Copyright Page -- Contents -- List of Figures -- Acknowledgments -- Introduction -- 1. Getting Started -- 1.1. Installing R -- 1.2. Installing RStudio -- 1.3. Learn R Basics -- 1.4. Installing Packages -- 1.5. Importing Data into R -- 1.6. Exercises -- 1.7. Brief Introduction to dplyr -- 1.8. Exercises -- 1.9. Mathematical Notation -- 2. Inference -- 2.1. Introduction -- 2.2. Random Variables -- 2.3. The Null Hypothesis -- 2.4. Distributions -- 2.5. Probability Distribution -- 2.6. Normal Distribution -- 2.7. Exercises
2.8. Populations, Samples and Estimates -- 2.9. Exercises -- 2.10. Central Limit Theorem and t-distribution -- 2.11. Exercises -- 2.12. Central Limit Theorem in Practice -- 2.13. Exercises -- 2.14. t-tests in Practice -- 2.15. The t-distribution in Practice -- 2.16. Confidence Intervals -- 2.17. Power Calculations -- 2.18. Exercises -- 2.19. Monte Carlo Simulation -- 2.20. Parametric Simulations for the Observations -- 2.21. Exercises -- 2.22 Permutation Tests -- 2.23. Exercises -- 2.24. Association Tests -- 2.25. Exercises -- 3. Exploratory Data Analysis -- 3.1. Quantile Quantile Plots
3.2. Boxplots -- 3.3. Scatterplots and Correlation -- 3.4. Stratification -- 3.5. Bivariate Normal Distribution -- 3.6. Plots to Avoid -- 3.7. Misunderstanding Correlation (Advanced) -- 3.8. Exercises -- 3.9. Robust Summaries -- 3.10. Wilcoxon Rank Sum Test -- 3.11. Exercises -- 4. Matrix Algebra -- 4.1. Motivating Examples -- 4.2. Exercises -- 4.3. Matrix Notation -- 4.4. Solving Systems of Equations -- 4.5. Vectors, Matrices, and Scalars -- 4.6. Exercises -- 4.7. Matrix Operations -- 4.8. Exercises -- 4.9. Examples -- 4.10. Exercises -- 5. Linear Models -- 5.1. Exercises
5.2. The Design Matrix -- 5.3. Exercises -- 5.4. The Mathematics Behind lm() -- 5.5. Exercises -- 5.6. Standard Errors -- 5.7. Exercises -- 5.8. Interactions and Contrasts -- 5.9. Linear Model with Interactions -- 5.10. Analysis of Variance -- 5.11. Exercises -- 5.12. Collinearity -- 5.13. Rank -- 5.14. Removing Confounding -- 5.15. Exercises -- 5.16. The QR Factorization (Advanced) -- 5.17. Going Further -- 6. Inference for High Dimensional Data -- 6.1. Introduction -- 6.2. Exercises -- 6.3. Inference in Practice -- 6.4. Exercises -- 6.5. Procedures -- 6.6. Error Rates
6.7. The Bonferroni Correction -- 6.8. False Discovery Rate -- 6.9. Direct Approach to FDR and q-values (Advanced) -- 6.10. Exercises -- 6.11. Basic Exploratory Data Analysis -- 6.12. Exercises -- 7. Statistical Models -- 7.1. The Binomial Distribution -- 7.2. The Poisson Distribution -- 7.3. Maximum Likelihood Estimation -- 7.4. Distributions for Positive Continuous Values -- 7.5. Exercises -- 7.6. Bayesian Statistics -- 7.7. Exercises -- 7.8. Hierarchical Models -- 7.9. Exercises -- 8. Distance and Dimension Reduction -- 8.1. Introduction -- 8.2. Euclidean Distance
8.3. Distance in High Dimensions
This book covers several of the statistical concepts and data analytic skills needed to succeed in data-driven life science research. The authors proceed from relatively basic concepts related to computed p-values to advanced topics related to analyzing highthroughput data. They include the R code that performs this analysis and connect the lines of code to the statistical and mathematical concepts explained. Nakladatelská anotace
Objectives: The goals of this study were to examine relationships among health literacy and outcomes for sub-populations identified within a large, multi-dimensional Omaha System dataset. Specific aims were to extract sub-populations from the data using Latent Class Analysis (LCA); and quantify the change in knowledge score from pre- to post-intervention for common sub-populations. Design: Data-driven retrospective study using statistical modeling methods. Sample: A set of admission and discharge cases, captured in the Omaha System, representing 65,468 cases from various health care providers. Measures: Demographic information and the Omaha System terms including problems, signs/symptoms, and interventions were used as the features describing cases used for this study. Development of a mapping of demographics across health care systems enabled the integration of data from these different systems. Results: Knowledge scores increased for all five sub-populations identified by latent class analysis. Effect sizes of interventions related to health literacy outcomes varied from low to high, with the greatest effect size in populations of young at-risk adults. The most significant knowledge gains were seen for problems including Pregnancy, Postpartum, Family planning, Mental health, and Substance use. Conclusions: This is the first study to demonstrate positive relationships between interventions and health literacy outcomes for a very large sample. A deeper analysis of the results, focusing on specific problems and relevant interventions and their impact on health literacy is required to guide resource allocation in community-based care. As such, future work will focus on determining correlations between interventions for specific problems and knowledge change post-intervention.
Závěrečná zpráva o řešení grantu Agentury pro zdravotnický výzkum MZ ČR
nestr.
Inherited metabolic diseases (IMDs) are the largest subgroup of rare diseases constituting serious health problems. They are typically caused by reduced enzyme activity or protein transporter function resulting in changes in metabolite levels. These abnormalities cause clinical symptoms and are key to diagnosis. The identification of novel biomarkers improves the efficiency of the diagnostic process. This is especially true for population-based screening programs where selectivity and specificity are the key issues. Identification of these biomarkers by traditional methods can be either random or based on biochemical principles, however, it is always difficult. In previous studies, we successfully applied tools for untargeted metabolomics to describe novel biomarkers of several IMDs in broad international collaboration. The aim of this project is discovery, structural elucidation, and validation of new biomarkers of IMDs by advanced mass spectrometry techniques. Biomarkers discovered within the project will ultimately improve diagnostics and screening programs of the diseases.
Dědičné metabolické poruchy (DMP) tvoří největší skupinu vzácných onemocnění a představují závažný zdravotnický problém. Jsou typicky způsobeny sníženou aktivitou enzymu či abnormální funkcí proteinového transportéru vedoucí ke změnám v hladinách metabolitů. Tyto biochemické odchylky způsobují klinické příznaky a jsou klíčem k diagnostice. Identifikace nových biomarkerů zvyšuje efektivitu diagnostického procesu, což je rozhodující zejména pro populační screeningové programy, kde selektivita a specificita jsou klíčovými pojmy. Nalezení těchto biomarkerů tradičními metodami je experimentálně obtížné a ve většině případů založené na náhodě. V předchozích experimentech jsme ve spolupráci s několika zahraničními pracovišti úspěšně použili metody necílené metabolomiky k popsání nových biomarkerů DMP. Cílem předkládaného projektu je detekce, strukturní elucidace a validace nových biomarkerů DMP pokročilými technikami hmotnostní spektrometrie. Nové biomarkery v konečném důsledku zlepší diagnostiku a screening DMP jak v České republice tak celosvětově.
- Klíčová slova
- biomarkery, biomarkers, Metabolomika, Dědičné metabolické poruchy, Hmotnostní spektrometrie, Metabolomics, Inborn Errors of Metabolism, Mass Spectrometry, novorozenecký screening, Mnohorozměrná statistická analýza, Vysoce dimenzionální data, Newborn screening, Multivariate statistical analysis, High-dimensional data,
- NLK Publikační typ
- závěrečné zprávy o řešení grantu AZV MZ ČR
Ratios Indiscriminately 58 -- 3.4 Determining Sample Size to Estimate a Correlation 59 -- 3.5 Pairing Data Between Variability and Uncertainty 113 -- 5.9 Description of the Database is As Important as Its Data 5.11 Measurement of a Standard and Policy 117 -- 5.12 Parametric Analyses Make Maximum Use of the Data 153 -- 7.2 Arrange Information in a Table to Drive Home the -- Message 155 -- 7.3 Always Graph the Data 167 -- 7.9 Use Rendering, Manipulation, and Linking in High -- Dimensional Data 170 -- Consulting 175
Wiley series in probability and statistics
1st ed. xviii, 221 s.
- Konspekt
- Statistika
- NLK Obory
- statistika, zdravotnická statistika
SEPARATIONS IN HIGH-PERFORMANCE CAPILLARY ELECTROPHORESIS 581 -- Thomas F. Two-Dimensional Separation -- Theory 583 -- 17.3. Three-Dimensional Size Exclusion Chromatography-Reversed-Phase Liquid Chromatography-High-Speed Capillary Two-Dimensional Separation -- Theory 583 -- 17.3. Three-Dimensional Size Exclusion Chromatography-Reversed-Phase Liquid Chromatography-High-Speed Capillary
Chemical analysis ; 146
1047 s.
- Klíčová slova
- elektroforéza kapilární,
- Konspekt
- Biochemie. Molekulární biologie. Biofyzika
- NLK Obory
- fyzika, biofyzika
- biomedicínské inženýrství
proteome 9 -- 1.3 Looking towards new frontiers 10 -- Acknowledgments .11 -- References .11 -- 2 Two-Dimensional 2.4 Low abundance proteins .19 -- 2.4.1 Cell fractionation and protein prefractionation 20 -- 2.4.2 High 2.7.1 Simplifying the IPG-SDS-PAGE interface .27 -- 2.7.2 Fluorescent protein detection 28 -- 2.7.3 High Appel -- 6.1 Introduction 149 -- 6.2 Past data integration techniques (3300 B.C. - 1993 A.D.) 150 -- 6.2.1 Data exchange on the Internet before WWW 151 -- 6.2.2 Hard media data distribution 152 -- 6.2.3
Principles and practice
1st ed. xviii, 243 s.
- Konspekt
- Obecná genetika. Obecná cytogenetika. Evoluce
- NLK Obory
- genetika, lékařská genetika
precepts 20 -- Informed consent 21 -- Rewards and inducements 22 -- Responsibility to diseased or high-risk 33 -- Misuse of survey data 33 -- Regression dilution bias 34 -- Generalizability 34 -- References 35 CONTENTS -- Population definition 67 -- Sample size 67 -- Measurements 67 -- Quality control 68 -- Data Data sources 69 -- Overview 69 -- Vital statistics 69 -- Routine patient data 70 -- Insurance data 71 103 -- Specific approaches 104 -- Evaluation of mortality data 107 -- v -- CONTENTS -- Standardized
3rd ed. xiv, 185 s. : il., tab., grafy ; 24 cm + 1 CD-ROM
- MeSH
- epidemiologické metody MeSH
- kardiovaskulární nemoci epidemiologie MeSH
- zdravotnické přehledy metody MeSH
- Konspekt
- Patologie. Klinická medicína
- NLK Obory
- kardiologie
- angiologie
- epidemiologie
- NLK Publikační typ
- publikace WHO
Medical image processing in an era of high-performance computing. 69 Branger PJ and Duisterhout JS. Christensen HI. -- Image and signal processing. -- Synopsis. -- 266 Madhukar B and Murthy ISN. -- ECG data J Nucl Med 1993;34:322-9. -- 290 Barillot C, Lemoine D, Le Briquer L, Lachmann F and Gibaud B. -- Data Animated visualization of a high resolution color three dimensional digital computer model of the whole A computerized three-dimensional atlas of the human skull and brain.
vi, 516 stran : ilustrace, tabulky ; 28 cm
The yearbook presents a collection of works that focus on medical informatics, specifically on medical information systems. Intended for professional public.
- MeSH
- chorobopisy - počítačové systémy MeSH
- management znalostí MeSH
- metody pro podporu rozhodování MeSH
- počítačové zpracování obrazu MeSH
- počítačové zpracování signálu MeSH
- řízení zdravotnictví MeSH
- studium lékařství MeSH
- zdravotnická komunikace MeSH
- zdravotnické informační systémy MeSH
- Publikační typ
- sborníky MeSH
- Konspekt
- Lékařské vědy. Lékařství
- NLK Obory
- lékařská informatika
- NLK Publikační typ
- ročenky
Urseleanu -- 129 Minimum basic data sets: Some lessons from 5 years of federal medical care data -- L Neame -- 297 Changing Slovenian health care data bases legislation M. Markota, M. Rogac -- 301 Medical data protection in Europe: New rules vs. actual trends -- J.A. Heijboer 431 Caput: A three-dimensional interactive atlas of the head/neck area A.R. Whannel -- 437 Towards a high quality computer-based patient record M. Xenos, D.
xix, 443 stran : ilustrace, tabulky ; 24 cm
- Konspekt
- Lékařské vědy. Lékařství
- NLK Obory
- lékařská informatika