data-mining
Dotaz
Zobrazit nápovědu
elektronický časopis
- MeSH
- data mining MeSH
- lékařství MeSH
- Konspekt
- Lékařské vědy. Lékařství
- NLK Obory
- lékařství
- lékařská informatika
- NLK Publikační typ
- elektronické časopisy
V souvislosti s narůstajícím objemem dostupných klinických dat dochází ke stále častějším aplikacím metod tzv. dolování dat („data-mining“) v klinickém výzkumu a praxi. Celý proces data-miningu lze rozdělit na řadu samostatných a poměrně snadno uchopitelných kroků od uložení dat a jejich přípravy, přes pochopení datové struktury souboru až po modelování a extrakci využitelných poznatků. Ve vytvořeném e-kurzu přinášíme kromě teoretického popisu metod i řadu řešených případových studií, např. při mapování genové exprese nebo při modelování strukturovaných dat z klinické praxe.
Data mining has become a standard approach in many fields of clinical research. The whole data-mining process can be divided into sets of simple logical steps from the data preparation and validation, through definition of data structure and statistical description, up to data modelling and mining. The newly developed e-learning course addresses all the main steps of the data mining together with case studies of microarrays data analysis.
- Klíčová slova
- CRISP-DM, microarrays,
- MeSH
- data mining * MeSH
- multimédia využití MeSH
- počítačem řízená výuka * MeSH
- vzdělávání odborné metody MeSH
- Geografické názvy
- Česká republika MeSH
Data mining (DM) is a widely adopted methodology for the analysis of large datasets which is on the other hand often overestimated or incorrectly considered as a universal solution. This statement is also valid for clinical research, in which large and heterogeneous datasets are often processed. DM in general uses standard methods available in common statistical software and combines them into a complex workflow methodology covering all the steps of data analysis from data acquisition through pre-processing and data analysis to interpretation of the results. The whole workflow is aimed at one final goal – to find any interesting, non-trivially hidden and potentially useful information. This innovative concept of data mining was adopted in our educational course of the Faculty of Medicine at the Masaryk University accessible from its e-learning portal http://portal. med.muni.cz/clanek-318-zavedeni-technologie-data-miningu-a-analyzy-dat--genovych-expresnich-map-do-vyuky.html.
- MeSH
- biostatistika metody MeSH
- data mining * metody trendy MeSH
- lidé MeSH
- multifaktorová rozměrová redukce metody MeSH
- počítačem řízená výuka * metody trendy MeSH
- Check Tag
- lidé MeSH
- Publikační typ
- práce podpořená grantem MeSH
A major challenge in cancer treatment is predicting the clinical response to anti-cancer drugs on a personalized basis. The success of such a task largely depends on the ability to develop computational resources that integrate big "omic" data into effective drug-response models. Machine learning is both an expanding and an evolving computational field that holds promise to cover such needs. Here we provide a focused overview of: 1) the various supervised and unsupervised algorithms used specifically in drug response prediction applications, 2) the strategies employed to develop these algorithms into applicable models, 3) data resources that are fed into these frameworks and 4) pitfalls and challenges to maximize model performance. In this context we also describe a novel in silico screening process, based on Association Rule Mining, for identifying genes as candidate drivers of drug response and compare it with relevant data mining frameworks, for which we generated a web application freely available at: https://compbio.nyumc.org/drugs/. This pipeline explores with high efficiency large sample-spaces, while is able to detect low frequency events and evaluate statistical significance even in the multidimensional space, presenting the results in the form of easily interpretable rules. We conclude with future prospects and challenges of applying machine learning based drug response prediction in precision medicine.
... Obsah -- 1 ÚVOD 9 -- 2 VZNIK A HISTORICKÉ KOŘENY ANALYTIKY A DATA MININGU -- VE VZDĚLÁVÁNI 13 -- 2.1 ... ... Historické kořeny data miningu ve vzdělávání 17 -- 2.2 Historické kořeny analytiky učení 19 -- 2.3 Další ... ... oblasti formující analytiku učení a data mining ve vzdělávání 21 -- 3 VYMEZENÍ ANALYTIKY A DATA MININGU ... ... 35 -- 4.1 Proces aplikace analytiky učení a data miningu ve vzdělávám 38 -- 4.2 Typy dat využívaných ... ... v oblasti analytiky učení a data miningu ve vzdělávání 43 -- 5 METODY A TECHNIKY ANALÝZY DAT 49 -- 5.1 ...
1. elektronické vydání 1 online zdroj (223 stran)
Analytika učení a data mining ve vzdělávání jsou nově se formující výzkumné oblasti zaměřující se na analýzu dat, která pocházejí z různých typů online vzdělávacích systémů. Tato publikace nabízí základní vhled do obou oblastí včetně jejich detailního představení. Seznamuje čtenáře s původem analytiky učení i data miningu ve vzdělávání, vysvětluje hlavní podobnosti a rozdíly mezi těmito oblastmi, popisuje používané metody a techniky analýzy dat a představuje nejvýznamnější směry výzkumu napříč oběma oblastmi. Kniha navíc obsahuje příklady konkrétních analýz, při kterých byly využity vybrané metody analytiky učení a data miningu ve vzdělávání v kontextu systémů pro řízení výuky.; Analytika učení a data mining ve vzdělávání jsou výzkumné oblasti zaměřující se na analýzu dat, která pocházejí z různých typů online vzdělávacích systémů. Publikace nabízí základní vhled do obou oblastí včetně jejich detailního předtavení.
Lipidomics and metabolomics communities comprise various informatics tools; however, software programs handling multimodal mass spectrometry (MS) data with structural annotations guided by the Lipidomics Standards Initiative are limited. Here, we provide MS-DIAL 5 for in-depth lipidome structural elucidation through electron-activated dissociation (EAD)-based tandem MS and determining their molecular localization through MS imaging (MSI) data using a species/tissue-specific lipidome database containing the predicted collision-cross section values. With the optimized EAD settings using 14 eV kinetic energy, the program correctly delineated lipid structures for 96.4% of authentic standards, among which 78.0% had the sn-, OH-, and/or C = C positions correctly assigned at concentrations exceeding 1 μM. We showcased our workflow by annotating the sn- and double-bond positions of eye-specific phosphatidylcholines containing very-long-chain polyunsaturated fatty acids (VLC-PUFAs), characterized as PC n-3-VLC-PUFA/FA. Using MSI data from the eye and n-3-VLC-PUFA-supplemented HeLa cells, we identified glycerol 3-phosphate acyltransferase as an enzyme candidate responsible for incorporating n-3 VLC-PUFAs into the sn1 position of phospholipids in mammalian cells, which was confirmed using EAD-MS/MS and recombinant proteins in a cell-free system. Therefore, the MS-DIAL 5 environment, combined with optimized MS data acquisition methods, facilitates a better understanding of lipid structures and their localization, offering insights into lipid biology.
- MeSH
- data mining * metody MeSH
- fosfatidylcholiny metabolismus chemie MeSH
- HeLa buňky MeSH
- hmotnostní spektrometrie metody MeSH
- lidé MeSH
- lipidomika * metody MeSH
- lipidy chemie analýza MeSH
- metabolomika metody MeSH
- nenasycené mastné kyseliny metabolismus chemie MeSH
- software MeSH
- tandemová hmotnostní spektrometrie metody MeSH
- zvířata MeSH
- Check Tag
- lidé MeSH
- zvířata MeSH
- Publikační typ
- časopisecké články MeSH
sv.
- MeSH
- výpočetní biologie * MeSH
- Publikační typ
- periodika MeSH
- Konspekt
- Obecná biologie
- NLK Obory
- biologie
Dental development is frequently used to estimate age in many anthropological specializations. The aim of this study was to extract an accurate predictive age system for the Czech population and to discover any different predictive ability of various tooth types and their ontogenetic stability during infancy and adolescence. A cross-sectional panoramic X-ray study was based on developmental stages assessment of mandibular teeth (Moorrees et al. 1963) using 1393 individuals aged from 3 to 17 years. Data mining methods were used for dental age estimation. These are based on nonlinear relationships between the predicted age and data sets. Compared with other tested predictive models, the GAME method predicted age with the highest accuracy. Age-interval estimations between the 10th and 90th percentiles ranged from -1.06 to +1.01 years in girls and from -1.13 to +1.20 in boys. Accuracy was expressed by RMS error, which is the average deviation between estimated and chronological age. The predictive value of individual teeth changed during the investigated period from 3 to 17 years. When we evaluated the whole period, the second molars exhibited the best predictive ability. When evaluating partial age periods, we found that the accuracy of biological age prediction declines with increasing age (from 0.52 to 1.20 years in girls and from 0.62 to 1.22 years in boys) and that the predictive importance of tooth types changes, depending on variability and the number of developmental stages in the age interval. GAME is a promising tool for age-interval estimation studies as they can provide reliable predictive models.
- MeSH
- data mining metody MeSH
- dítě MeSH
- lidé MeSH
- mladiství MeSH
- předškolní dítě MeSH
- průřezové studie MeSH
- regresní analýza MeSH
- rentgendiagnostika panoramatická MeSH
- statistické modely MeSH
- support vector machine MeSH
- určení zubního věku metody MeSH
- zuby anatomie a histologie radiografie MeSH
- Check Tag
- dítě MeSH
- lidé MeSH
- mladiství MeSH
- mužské pohlaví MeSH
- předškolní dítě MeSH
- ženské pohlaví MeSH
- Publikační typ
- časopisecké články MeSH
- práce podpořená grantem MeSH
Recently published studies showed that age assessment methods are population specific. Authors analyse the senescence changes in pubic symphysis and sacro-pelvic surface of a pelvic bone using data mining methods. The multi-ethnic data set consists of 956 adult individuals ranging from 19 to 100 years of age derived from 9 different populations with known age and sex. The results show that accurate and reliable age assessment is possible to three age classes (less than 30, 30-60, 60 and more). The study confirms that population specificity of the methods exists and the variable "sex" is not important in age classification.
- MeSH
- algoritmy MeSH
- data mining metody MeSH
- dospělí MeSH
- etnicita MeSH
- lidé středního věku MeSH
- lidé MeSH
- os ilium anatomie a histologie MeSH
- rasové skupiny MeSH
- ROC křivka MeSH
- senioři nad 80 let MeSH
- senioři MeSH
- soudní antropologie MeSH
- symphysis pubica anatomie a histologie MeSH
- určení kostního věku metody MeSH
- Check Tag
- dospělí MeSH
- lidé středního věku MeSH
- lidé MeSH
- mužské pohlaví MeSH
- senioři nad 80 let MeSH
- senioři MeSH
- ženské pohlaví MeSH
- Publikační typ
- časopisecké články MeSH