elektronický časopis
- MeSH
- Data Mining MeSH
- Medicine MeSH
- Conspectus
- Lékařské vědy. Lékařství
- NML Fields
- lékařství
- lékařská informatika
- NML Publication type
- elektronické časopisy
V souvislosti s narůstajícím objemem dostupných klinických dat dochází ke stále častějším aplikacím metod tzv. dolování dat („data-mining“) v klinickém výzkumu a praxi. Celý proces data-miningu lze rozdělit na řadu samostatných a poměrně snadno uchopitelných kroků od uložení dat a jejich přípravy, přes pochopení datové struktury souboru až po modelování a extrakci využitelných poznatků. Ve vytvořeném e-kurzu přinášíme kromě teoretického popisu metod i řadu řešených případových studií, např. při mapování genové exprese nebo při modelování strukturovaných dat z klinické praxe.
Data mining has become a standard approach in many fields of clinical research. The whole data-mining process can be divided into sets of simple logical steps from the data preparation and validation, through definition of data structure and statistical description, up to data modelling and mining. The newly developed e-learning course addresses all the main steps of the data mining together with case studies of microarrays data analysis.
- Keywords
- CRISP-DM, microarrays,
- MeSH
- Data Mining * MeSH
- Multimedia utilization MeSH
- Computer-Assisted Instruction * MeSH
- Education, Professional methods MeSH
- Geographicals
- Czech Republic MeSH
Data mining (DM) is a widely adopted methodology for the analysis of large datasets which is on the other hand often overestimated or incorrectly considered as a universal solution. This statement is also valid for clinical research, in which large and heterogeneous datasets are often processed. DM in general uses standard methods available in common statistical software and combines them into a complex workflow methodology covering all the steps of data analysis from data acquisition through pre-processing and data analysis to interpretation of the results. The whole workflow is aimed at one final goal – to find any interesting, non-trivially hidden and potentially useful information. This innovative concept of data mining was adopted in our educational course of the Faculty of Medicine at the Masaryk University accessible from its e-learning portal http://portal. med.muni.cz/clanek-318-zavedeni-technologie-data-miningu-a-analyzy-dat--genovych-expresnich-map-do-vyuky.html.
A major challenge in cancer treatment is predicting the clinical response to anti-cancer drugs on a personalized basis. The success of such a task largely depends on the ability to develop computational resources that integrate big "omic" data into effective drug-response models. Machine learning is both an expanding and an evolving computational field that holds promise to cover such needs. Here we provide a focused overview of: 1) the various supervised and unsupervised algorithms used specifically in drug response prediction applications, 2) the strategies employed to develop these algorithms into applicable models, 3) data resources that are fed into these frameworks and 4) pitfalls and challenges to maximize model performance. In this context we also describe a novel in silico screening process, based on Association Rule Mining, for identifying genes as candidate drivers of drug response and compare it with relevant data mining frameworks, for which we generated a web application freely available at: https://compbio.nyumc.org/drugs/. This pipeline explores with high efficiency large sample-spaces, while is able to detect low frequency events and evaluate statistical significance even in the multidimensional space, presenting the results in the form of easily interpretable rules. We conclude with future prospects and challenges of applying machine learning based drug response prediction in precision medicine.
- MeSH
- Data Mining * MeSH
- Humans MeSH
- Neoplasms drug therapy MeSH
- Computer Simulation MeSH
- Machine Learning * MeSH
- Treatment Outcome MeSH
- Animals MeSH
- Check Tag
- Humans MeSH
- Animals MeSH
- Publication type
- Journal Article MeSH
- Research Support, Non-U.S. Gov't MeSH
- Review MeSH
- Research Support, N.I.H., Extramural MeSH
Cíl studie: Cílem práce je explorační počítačová analýza dat o léčebných cyklech asistované reprodukce (AR) a ověření použitelnosti systému pro dolování znalostí z dat SHLUK v dílčí analýze procesu oplozování oocytů in vitro.Typ studie: Retrospektivní analýza.Název a sídlo pracoviště: I. gynek.-porod. klinika LF MU v Brně, FEI, VŠB, Ostrava.Metodika a materiál: Prostřednictvím systému SHLUK, který zahrnuje řadu metod mnohorozměrné analýzy dat, byly hledány okolnosti úspěšné léčby v jednotlivých etapách cyklu AR. Analýza vztahů mezi příčinami a následky léčebného cyklu AR byla provedena metodou IMPL a následně metodou skupinové implikace GRIMPL.Soubor analyzovaný systémem SHLUK zahrnuje data z 8516 léčebných cyklů AR provedených u 4470 pacientek a údaje o 666 klinických graviditách po AR. Data o léčebných cyklech byla uložena v elektronické podobě v klinickém registru dat. Modelová analýza etapy fertilizace, je zaměřena na vztahy mezi parametry spermiogramu a výsledkem procesu oplozování oocytů in vitro. Jako výstupní kritérium úspěšnosti etapy fertilizace v cyklu AR bylo hodnoceno procento oplozených oocytů z počtu získaných oocytů při aspiraci - fertilisation rate (FR).Výsledky: Signifikantně vyšší FR - 60,9 % bylo zjištěno ve skupině vyšetření s počtem spermií před zpracováním 41 - 60 mil/ml. Při počtu spermií před zpracováním pod 10 mil/ml bylo FR signifikantně nižší - 42,2 %. Při pohyblivosti spermií před zpracováním 41 - 50 % bylo FR signifikantně vyšší - 56,9 %. Signifikantně vyšší FR - min. 56,0 % bylo zjištěno při počtu spermií po zpracování 4,1 mil/ml a více. Při pohyblivosti spermií po zpracování 41 - 90 % bylo FR signifikantně vyšší - min. 53,5 %. Ve skupině vyšetření, kde přežívalo v kultivačním mediu po 24hodinové kultivaci s oocytem více než 30 % spermií bylo FR signifikantně vyšší - min. 55,9 %.Závěr: Byla prokázána použitelnost systému pro dolování znalostí z dat SHLUK pro analýzu faktorů, které ovlivňují výsledky metod asistované reprodukce. Systém pro dolování znalostí z databází SHLUK umožňuje definovat statisticky významné vztahy mezi jednotlivými atributy etapy fertilizace v léčebném cyklu AR a dokáže postulovat základní hypotézy o existujících příčinách a následcích v cyklech AR.
Objective: To retrospective explorating computer analysis of data about therapeutic cycles in assisted reproduction technology (ART) to confirm applicability of system for data mining SHLUK in partial analysis of fertilisation phase of therapeutic cycle. Relations between parameters of sperm count analysis and outcome of in vitro fertilisation were analyzed.Design: Retrospective analysis.Setting: 1st Depart of Obstet. and Gynaecol., Masaryk University, Brno; FEI, VŠB, Ostrava.Methods and material: Conditions of successful therapy in single phases of ART therapeutic cycles, were analysed using system SHLUK, which included a lot of methods for data mining. Analysis of relation between reasons and results in ART therapeutic cycles was done through method IMPL and method of group implication GRIMPL.Analysed file included data about 8516 therapeutic cycles ART in 4470 patients and data about 666 clinical pregnancies stored in electronical form in clinical data register. The model analysis of fertilisation tested relations between parameters of sperm analysis and outcome of in vitro fertilisation. Fertilisation rate (FR) - ratio of fertilized oocytes/obtained oocytes was evaluated as fertilisation stage outcome.Results: Significantly higher FR - 60.9 % was in the group with sperm concentration before preparation 41 - 60 min/ml. When sperm concentration before preparation was under 10 mil/ml - FR was significantly lower - 45.3 %. Motility of sperm before preparation 41 - 50 % - FR was significantly higher - 56.9 %. Significantly higher FR - minimal 56.0 % was in group of examinations with sperm after preparation was 41 - 90 %, then FR was significantly higher - 53.5 %. In sperm survival test, where more than 30 % of sperm survive 24 hours of cocultivation with oocytes FR was significantly higher - minimal 55.9 %.Conclusion: Applicability of system for data mining SHLUK in the analysis of factors with influence on assisted reproduction outcome was proved. System for data mining SHLUK makes posible to define statisticaly significant relations between atributes of fertilisation stage of ART cycles and it is able to postulate basic hypothesis about existing reasons and results in therapeutic cycles of ART.
... Obsah -- 1 ÚVOD 9 -- 2 VZNIK A HISTORICKÉ KOŘENY ANALYTIKY A DATA MININGU -- VE VZDĚLÁVÁNI 13 -- 2.1 ... ... Historické kořeny data miningu ve vzdělávání 17 -- 2.2 Historické kořeny analytiky učení 19 -- 2.3 Další ... ... oblasti formující analytiku učení a data mining ve vzdělávání 21 -- 3 VYMEZENÍ ANALYTIKY A DATA MININGU ... ... 35 -- 4.1 Proces aplikace analytiky učení a data miningu ve vzdělávám 38 -- 4.2 Typy dat využívaných ... ... v oblasti analytiky učení a data miningu ve vzdělávání 43 -- 5 METODY A TECHNIKY ANALÝZY DAT 49 -- 5.1 ...
1. elektronické vydání 1 online zdroj (223 stran)
Analytika učení a data mining ve vzdělávání jsou nově se formující výzkumné oblasti zaměřující se na analýzu dat, která pocházejí z různých typů online vzdělávacích systémů. Tato publikace nabízí základní vhled do obou oblastí včetně jejich detailního představení. Seznamuje čtenáře s původem analytiky učení i data miningu ve vzdělávání, vysvětluje hlavní podobnosti a rozdíly mezi těmito oblastmi, popisuje používané metody a techniky analýzy dat a představuje nejvýznamnější směry výzkumu napříč oběma oblastmi. Kniha navíc obsahuje příklady konkrétních analýz, při kterých byly využity vybrané metody analytiky učení a data miningu ve vzdělávání v kontextu systémů pro řízení výuky.; Analytika učení a data mining ve vzdělávání jsou výzkumné oblasti zaměřující se na analýzu dat, která pocházejí z různých typů online vzdělávacích systémů. Publikace nabízí základní vhled do obou oblastí včetně jejich detailního předtavení.
sv.
- MeSH
- Computational Biology * MeSH
- Publication type
- Periodical MeSH
- Conspectus
- Obecná biologie
- NML Fields
- biologie
Lipidomics and metabolomics communities comprise various informatics tools; however, software programs handling multimodal mass spectrometry (MS) data with structural annotations guided by the Lipidomics Standards Initiative are limited. Here, we provide MS-DIAL 5 for in-depth lipidome structural elucidation through electron-activated dissociation (EAD)-based tandem MS and determining their molecular localization through MS imaging (MSI) data using a species/tissue-specific lipidome database containing the predicted collision-cross section values. With the optimized EAD settings using 14 eV kinetic energy, the program correctly delineated lipid structures for 96.4% of authentic standards, among which 78.0% had the sn-, OH-, and/or C = C positions correctly assigned at concentrations exceeding 1 μM. We showcased our workflow by annotating the sn- and double-bond positions of eye-specific phosphatidylcholines containing very-long-chain polyunsaturated fatty acids (VLC-PUFAs), characterized as PC n-3-VLC-PUFA/FA. Using MSI data from the eye and n-3-VLC-PUFA-supplemented HeLa cells, we identified glycerol 3-phosphate acyltransferase as an enzyme candidate responsible for incorporating n-3 VLC-PUFAs into the sn1 position of phospholipids in mammalian cells, which was confirmed using EAD-MS/MS and recombinant proteins in a cell-free system. Therefore, the MS-DIAL 5 environment, combined with optimized MS data acquisition methods, facilitates a better understanding of lipid structures and their localization, offering insights into lipid biology.
- MeSH
- Data Mining * methods MeSH
- Phosphatidylcholines metabolism chemistry MeSH
- HeLa Cells MeSH
- Mass Spectrometry methods MeSH
- Humans MeSH
- Lipidomics * methods MeSH
- Lipids chemistry analysis MeSH
- Metabolomics methods MeSH
- Fatty Acids, Unsaturated metabolism chemistry MeSH
- Software MeSH
- Tandem Mass Spectrometry methods MeSH
- Animals MeSH
- Check Tag
- Humans MeSH
- Animals MeSH
- Publication type
- Journal Article MeSH
Dental development is frequently used to estimate age in many anthropological specializations. The aim of this study was to extract an accurate predictive age system for the Czech population and to discover any different predictive ability of various tooth types and their ontogenetic stability during infancy and adolescence. A cross-sectional panoramic X-ray study was based on developmental stages assessment of mandibular teeth (Moorrees et al. 1963) using 1393 individuals aged from 3 to 17 years. Data mining methods were used for dental age estimation. These are based on nonlinear relationships between the predicted age and data sets. Compared with other tested predictive models, the GAME method predicted age with the highest accuracy. Age-interval estimations between the 10th and 90th percentiles ranged from -1.06 to +1.01 years in girls and from -1.13 to +1.20 in boys. Accuracy was expressed by RMS error, which is the average deviation between estimated and chronological age. The predictive value of individual teeth changed during the investigated period from 3 to 17 years. When we evaluated the whole period, the second molars exhibited the best predictive ability. When evaluating partial age periods, we found that the accuracy of biological age prediction declines with increasing age (from 0.52 to 1.20 years in girls and from 0.62 to 1.22 years in boys) and that the predictive importance of tooth types changes, depending on variability and the number of developmental stages in the age interval. GAME is a promising tool for age-interval estimation studies as they can provide reliable predictive models.
- MeSH
- Data Mining methods MeSH
- Child MeSH
- Humans MeSH
- Adolescent MeSH
- Child, Preschool MeSH
- Cross-Sectional Studies MeSH
- Regression Analysis MeSH
- Radiography, Panoramic MeSH
- Models, Statistical MeSH
- Support Vector Machine MeSH
- Age Determination by Teeth methods MeSH
- Tooth anatomy & histology radiography MeSH
- Check Tag
- Child MeSH
- Humans MeSH
- Adolescent MeSH
- Male MeSH
- Child, Preschool MeSH
- Female MeSH
- Publication type
- Journal Article MeSH
- Research Support, Non-U.S. Gov't MeSH