data-mining Dotaz Zobrazit nápovědu
elektronický časopis
- MeSH
- data mining MeSH
- lékařství MeSH
- Konspekt
- Lékařské vědy. Lékařství
- NLK Obory
- lékařství
- lékařská informatika
- NLK Publikační typ
- elektronické časopisy
V souvislosti s narůstajícím objemem dostupných klinických dat dochází ke stále častějším aplikacím metod tzv. dolování dat („data-mining“) v klinickém výzkumu a praxi. Celý proces data-miningu lze rozdělit na řadu samostatných a poměrně snadno uchopitelných kroků od uložení dat a jejich přípravy, přes pochopení datové struktury souboru až po modelování a extrakci využitelných poznatků. Ve vytvořeném e-kurzu přinášíme kromě teoretického popisu metod i řadu řešených případových studií, např. při mapování genové exprese nebo při modelování strukturovaných dat z klinické praxe.
Data mining has become a standard approach in many fields of clinical research. The whole data-mining process can be divided into sets of simple logical steps from the data preparation and validation, through definition of data structure and statistical description, up to data modelling and mining. The newly developed e-learning course addresses all the main steps of the data mining together with case studies of microarrays data analysis.
- Klíčová slova
- CRISP-DM, microarrays,
- MeSH
- data mining * MeSH
- multimédia využití MeSH
- počítačem řízená výuka * MeSH
- vzdělávání odborné metody MeSH
- Geografické názvy
- Česká republika MeSH
1st ed. xviii, 401 s.
- Klíčová slova
- Bioinformatika, Multimedia, Data,
- Konspekt
- Lékařské vědy. Lékařství
- NLK Obory
- lékařská informatika
- Klíčová slova
- statistika, vícerozměrná analýza, velké datové soubory,
- MeSH
- databáze genetické trendy využití MeSH
- distanční studium metody trendy MeSH
- financování organizované MeSH
- genetické techniky trendy využití MeSH
- lékařská informatika MeSH
- lidé MeSH
- počítačem řízená výuka přístrojové vybavení využití MeSH
- sběr dat metody trendy MeSH
- statistika jako téma MeSH
- teoretické modely MeSH
- zobrazování dat trendy MeSH
- Check Tag
- lidé MeSH
- Publikační typ
- databáze MeSH
Data mining (DM) is a widely adopted methodology for the analysis of large datasets which is on the other hand often overestimated or incorrectly considered as a universal solution. This statement is also valid for clinical research, in which large and heterogeneous datasets are often processed. DM in general uses standard methods available in common statistical software and combines them into a complex workflow methodology covering all the steps of data analysis from data acquisition through pre-processing and data analysis to interpretation of the results. The whole workflow is aimed at one final goal – to find any interesting, non-trivially hidden and potentially useful information. This innovative concept of data mining was adopted in our educational course of the Faculty of Medicine at the Masaryk University accessible from its e-learning portal http://portal. med.muni.cz/clanek-318-zavedeni-technologie-data-miningu-a-analyzy-dat--genovych-expresnich-map-do-vyuky.html.
- MeSH
- biostatistika metody MeSH
- data mining * metody trendy MeSH
- lidé MeSH
- multifaktorová rozměrová redukce metody MeSH
- počítačem řízená výuka * metody trendy MeSH
- Check Tag
- lidé MeSH
- Publikační typ
- práce podpořená grantem MeSH
A major challenge in cancer treatment is predicting the clinical response to anti-cancer drugs on a personalized basis. The success of such a task largely depends on the ability to develop computational resources that integrate big "omic" data into effective drug-response models. Machine learning is both an expanding and an evolving computational field that holds promise to cover such needs. Here we provide a focused overview of: 1) the various supervised and unsupervised algorithms used specifically in drug response prediction applications, 2) the strategies employed to develop these algorithms into applicable models, 3) data resources that are fed into these frameworks and 4) pitfalls and challenges to maximize model performance. In this context we also describe a novel in silico screening process, based on Association Rule Mining, for identifying genes as candidate drivers of drug response and compare it with relevant data mining frameworks, for which we generated a web application freely available at: https://compbio.nyumc.org/drugs/. This pipeline explores with high efficiency large sample-spaces, while is able to detect low frequency events and evaluate statistical significance even in the multidimensional space, presenting the results in the form of easily interpretable rules. We conclude with future prospects and challenges of applying machine learning based drug response prediction in precision medicine.
Cíl studie: Cílem práce je explorační počítačová analýza dat o léčebných cyklech asistované reprodukce (AR) a ověření použitelnosti systému pro dolování znalostí z dat SHLUK v dílčí analýze procesu oplozování oocytů in vitro.Typ studie: Retrospektivní analýza.Název a sídlo pracoviště: I. gynek.-porod. klinika LF MU v Brně, FEI, VŠB, Ostrava.Metodika a materiál: Prostřednictvím systému SHLUK, který zahrnuje řadu metod mnohorozměrné analýzy dat, byly hledány okolnosti úspěšné léčby v jednotlivých etapách cyklu AR. Analýza vztahů mezi příčinami a následky léčebného cyklu AR byla provedena metodou IMPL a následně metodou skupinové implikace GRIMPL.Soubor analyzovaný systémem SHLUK zahrnuje data z 8516 léčebných cyklů AR provedených u 4470 pacientek a údaje o 666 klinických graviditách po AR. Data o léčebných cyklech byla uložena v elektronické podobě v klinickém registru dat. Modelová analýza etapy fertilizace, je zaměřena na vztahy mezi parametry spermiogramu a výsledkem procesu oplozování oocytů in vitro. Jako výstupní kritérium úspěšnosti etapy fertilizace v cyklu AR bylo hodnoceno procento oplozených oocytů z počtu získaných oocytů při aspiraci - fertilisation rate (FR).Výsledky: Signifikantně vyšší FR - 60,9 % bylo zjištěno ve skupině vyšetření s počtem spermií před zpracováním 41 - 60 mil/ml. Při počtu spermií před zpracováním pod 10 mil/ml bylo FR signifikantně nižší - 42,2 %. Při pohyblivosti spermií před zpracováním 41 - 50 % bylo FR signifikantně vyšší - 56,9 %. Signifikantně vyšší FR - min. 56,0 % bylo zjištěno při počtu spermií po zpracování 4,1 mil/ml a více. Při pohyblivosti spermií po zpracování 41 - 90 % bylo FR signifikantně vyšší - min. 53,5 %. Ve skupině vyšetření, kde přežívalo v kultivačním mediu po 24hodinové kultivaci s oocytem více než 30 % spermií bylo FR signifikantně vyšší - min. 55,9 %.Závěr: Byla prokázána použitelnost systému pro dolování znalostí z dat SHLUK pro analýzu faktorů, které ovlivňují výsledky metod asistované reprodukce. Systém pro dolování znalostí z databází SHLUK umožňuje definovat statisticky významné vztahy mezi jednotlivými atributy etapy fertilizace v léčebném cyklu AR a dokáže postulovat základní hypotézy o existujících příčinách a následcích v cyklech AR.
Objective: To retrospective explorating computer analysis of data about therapeutic cycles in assisted reproduction technology (ART) to confirm applicability of system for data mining SHLUK in partial analysis of fertilisation phase of therapeutic cycle. Relations between parameters of sperm count analysis and outcome of in vitro fertilisation were analyzed.Design: Retrospective analysis.Setting: 1st Depart of Obstet. and Gynaecol., Masaryk University, Brno; FEI, VŠB, Ostrava.Methods and material: Conditions of successful therapy in single phases of ART therapeutic cycles, were analysed using system SHLUK, which included a lot of methods for data mining. Analysis of relation between reasons and results in ART therapeutic cycles was done through method IMPL and method of group implication GRIMPL.Analysed file included data about 8516 therapeutic cycles ART in 4470 patients and data about 666 clinical pregnancies stored in electronical form in clinical data register. The model analysis of fertilisation tested relations between parameters of sperm analysis and outcome of in vitro fertilisation. Fertilisation rate (FR) - ratio of fertilized oocytes/obtained oocytes was evaluated as fertilisation stage outcome.Results: Significantly higher FR - 60.9 % was in the group with sperm concentration before preparation 41 - 60 min/ml. When sperm concentration before preparation was under 10 mil/ml - FR was significantly lower - 45.3 %. Motility of sperm before preparation 41 - 50 % - FR was significantly higher - 56.9 %. Significantly higher FR - minimal 56.0 % was in group of examinations with sperm after preparation was 41 - 90 %, then FR was significantly higher - 53.5 %. In sperm survival test, where more than 30 % of sperm survive 24 hours of cocultivation with oocytes FR was significantly higher - minimal 55.9 %.Conclusion: Applicability of system for data mining SHLUK in the analysis of factors with influence on assisted reproduction outcome was proved. System for data mining SHLUK makes posible to define statisticaly significant relations between atributes of fertilisation stage of ART cycles and it is able to postulate basic hypothesis about existing reasons and results in therapeutic cycles of ART.
- Publikační typ
- abstrakt z konference MeSH
sv.
- MeSH
- výpočetní biologie * MeSH
- Publikační typ
- periodika MeSH
- Konspekt
- Obecná biologie
- NLK Obory
- biologie
Lipidomics and metabolomics communities comprise various informatics tools; however, software programs handling multimodal mass spectrometry (MS) data with structural annotations guided by the Lipidomics Standards Initiative are limited. Here, we provide MS-DIAL 5 for in-depth lipidome structural elucidation through electron-activated dissociation (EAD)-based tandem MS and determining their molecular localization through MS imaging (MSI) data using a species/tissue-specific lipidome database containing the predicted collision-cross section values. With the optimized EAD settings using 14 eV kinetic energy, the program correctly delineated lipid structures for 96.4% of authentic standards, among which 78.0% had the sn-, OH-, and/or C = C positions correctly assigned at concentrations exceeding 1 μM. We showcased our workflow by annotating the sn- and double-bond positions of eye-specific phosphatidylcholines containing very-long-chain polyunsaturated fatty acids (VLC-PUFAs), characterized as PC n-3-VLC-PUFA/FA. Using MSI data from the eye and n-3-VLC-PUFA-supplemented HeLa cells, we identified glycerol 3-phosphate acyltransferase as an enzyme candidate responsible for incorporating n-3 VLC-PUFAs into the sn1 position of phospholipids in mammalian cells, which was confirmed using EAD-MS/MS and recombinant proteins in a cell-free system. Therefore, the MS-DIAL 5 environment, combined with optimized MS data acquisition methods, facilitates a better understanding of lipid structures and their localization, offering insights into lipid biology.
- MeSH
- data mining * metody MeSH
- fosfatidylcholiny metabolismus chemie MeSH
- HeLa buňky MeSH
- hmotnostní spektrometrie metody MeSH
- lidé MeSH
- lipidomika * metody MeSH
- lipidy chemie analýza MeSH
- metabolomika metody MeSH
- nenasycené mastné kyseliny metabolismus chemie MeSH
- software MeSH
- tandemová hmotnostní spektrometrie metody MeSH
- zvířata MeSH
- Check Tag
- lidé MeSH
- zvířata MeSH
- Publikační typ
- časopisecké články MeSH