Machine-learning
Dotaz
Zobrazit nápovědu
Digitalizace laboratoří, aplikace big dat a automatizovaná strojová diagnostika ("machine learning") jsou nástroji pro vznik a fungování toho, co se označuje jako precizní medicína. Genomika, její dominantní metody (qPCR, dPCR, ddPCR, NGS), produkující obrovská kvanta dat (big data) a schopnosti počítačových systémů tyto soubory dat využívat v diagnostice a terapii za významného přispění "umělé inteligence" se označují jako strojová automatizovaná diagnostika - machine learning respektive deep learning). Tyto postupy pronikají z průmyslu a výzkumu do rutinní medicíny včetně medicíny laboratorní. Zvládnutí technických a personálních problémů těchto změn bude stát značné úsilí, srovnatelné s před lety realizovanou přeměnou manuální laboratorní práce na automatizovanou činnost a s přeměnou papírové dokumentace výsledků na laboratorní a nemocniční informační systémy. Lze předpokládat nejen zásadní změny metod laboratorní práce, ale i změny požadavků na odbornost personálu laboratoří a rovněž lze předpokládat nevyhnutelnost radikálního ovlivnění činnosti klinických laboratoří. Etický rozměr nastávajících změn bude stejně závažný, jako ten technický a bude možné očekávat nejen významný progres v diagnostice e prognostice chorob, ale i vzestup rizika zdravotní péče v případě chyb a neprofesionality. Automatická strojová aplikace big dat a používání umělé inteligence jsou náročné, je s nimi v medicíně málo zkušeností, ale vyhnout se jim nebude možné.
Digitalization of clinical laboratories, application of big data and methods of machine learning re contemporary tools for precision medicine. Precision medicine is based mainly on the genomic methods, namely of dominant PCR and NGS methods. These methods produces enormous number of dates (big data) and can be explored by means of artificial intelligence in processes called machine learning. Machine learning was primarily used in industry and research and now contemporary penetrates into medicine and also to laboratory medicine. Methods based on the big data and artificial intelligence with exploration of big data is certainly very important factor of future of medicine. It will be needs large requirements not only on high-technology equipment, but also for new type of young laboratory Professional used basically new methods of work and mind. Machine learning, part of precision medicine, necessary namely for oncology and prediction of patients state crettemeans also lot of new types of ethical problems. These ethical questions and problems should be soluted immediately, parallel with introduction of machine learning to laboratory practice.
Pathophysiological recordings of patients measured from various testing methods are frequently used in the medical field for determining symptoms as well as for probability prediction for selected diseases. There are numerous symptoms among the Parkinson's disease (PD) population, however changes in speech and articulation – is potentially the most significant biomarker. This article is focused on PD diagnosis classification based on their speech signals using pattern recognition methods (AdaBoost, Bagged trees, Quadratic SVM and k-NN). The dataset investigated in the article consists of 30 PD and 30 HC individuals' voice measurements, with each individual being represented with 2 recordings within the dataset. Training signals for PD and HC underwent an extraction of relatively well-discriminating features relating to energy and spectral speech properties. Model implementations included a 5-fold cross validation. The accuracy of the values obtained employing the models was calculated using the confusion matrix. The average value of the overall accuracy = 82.3 % and averaged AUC = 0.88 (min. AUC = 0.86) on the available data.
Techniky strojového učení jsou metody, které umožní vytvořit z trénovací množiny případů model pro kategorie dat tak, že mohou být nové (neznámé) případy zařazeny do jedné nebo více kategorií schématem odpovídajícím modelu. Pro tento typ analýzy jsou velmi vhodná data ze studií sledujících určitou skupinu osob s opakovaným sběrem dat stejného typu. K vyhledávání znalostí z medicínských dat bylo užito různých algoritmů strojového učení. Bylo testováno několik algoritmů tak, aby bylo možno pokrýt většinu způsobů učení s učitelem. Byly provedeny dva typy pokusů. Jeden hledal vztahy mezi atributy, druhý testoval predikci budoucích příhod. Pro pokusy v tomto sdělení byla užita data z dvacet let trvající longitudinální primárně preventivní studie rizikových faktorů (RF) aterosklerózy u mužů středního věku. Studie se nazývá STULONG (LONGitudinal STUdy). Výsledky ukazují, že některé metody předpovídají některé poruchy lépe než jiné a že je tedy vhodné použít všechny algoritmy najednou a posuzovat spolehlivost výsledku na základě známého trendu každé metody. Algoritmy strojového učení byly také použity k předpovědi příčiny úmrtí. V tomto případě byly výsledky nevalné, pravděpodobně pro malé množství informace ve vstupních položkách v datového souboru.
Machine learning techniques are methods that given a training set of examples infer a model for the categories of the data, so that new (unknown) examples could be assigned to one or more categories by pattern matching within the model. The data from follow-up studies with repeated collection of the same type of data are very suitable for this analysis. Machine learning algorithms belonging to a variety of paradigms have been applied to knowledge discovery on medical data. All the used algorithms belong to the supervised learning paradigm. Several algorithms have been tested, trying to cover most of the kinds of supervised learning. Two kinds of experiments have been carried out. The first is intended to discover associations between attributes. The second kind is intended to test prediction of future disorders. For the experiments in this paper the data used was from the twenty years lasting primary preventive longitudinal study of the risk factors (RF) of atherosclerosis in middle aged men. Study is named STULONG (LONGitudinal STUdy). The results show that some methods predict some disorders better than others, so it is interesting to use all the algorithms at a time and consider the result confidence based upon the known tendency of each method. The machine learning algorithms have been also used in the prediction of death cause, obtaining poor results in this case, maybe due to the small amount of information (entries) of this type in the dataset.
- Klíčová slova
- dobývání znalostí, strojové učení s učitelem, vytěžování z biomedicínských dat, rizikové faktory aterosklerózy,
- MeSH
- algoritmy MeSH
- ateroskleróza diagnóza MeSH
- databáze faktografické MeSH
- financování organizované MeSH
- lidé středního věku MeSH
- lidé MeSH
- metody pro podporu rozhodování MeSH
- prognóza MeSH
- rizikové faktory MeSH
- systémy pro podporu klinického rozhodování MeSH
- ukládání a vyhledávání informací MeSH
- znalostní báze MeSH
- Check Tag
- lidé středního věku MeSH
- lidé MeSH
- mužské pohlaví MeSH
Digitalizace postupně proniká do velké části medicínských oblastí včetně patologie. Společně s digitálním zpracováním dat přichází aplikace metod umělé inteligence za účelem zjednodušení rutinních procesů, zvýšení bezpečnosti apod. Ačkoliv se obecné povědomí o metodách umělé inteligence zvyšuje, stále není pravidlem, že by odborníci z netechnických oborů měli detailní představu o tom, jak takové systémy fungují a jak se učí. Cílem tohoto textu je přístupnou formou vysvětlit základy strojového učení s využitím příkladů a ilustrací z oblasti digitální patologie. Nejedná se samozřejmě o ucelený přehled ani o představení nejmodernějších metod. Držíme se spíše úplných základů a představujeme fundamentální myšlenky, které stojí za většinou učících systémů, s použitím nejjednodušších modelů. V textu se věnujeme zejména rozhodovacím stromům, jejichž funkce je snadno vysvětlitelná, a elementárním neuronovým sítím, které jsou hlavním modelem používaným v dnešní umělé inteligenci. Pokusíme se také popsat postup spolupráce mezi lékaři, kteří dodávají data, a informatiky, kteří s jejich pomocí vytvářejí učící systémy. Věříme, že tento text pomůže překlenout rozdíly mezi znalostmi lékařů a informatiků a tím přispěje k efektivnější mezioborové spolupráci.
Digitalization has gradually made its way into many areas of medicine, including pathology. Along with digital data processing comes the application of artificial intelligence methods to simplify routine processes, enhance safety, etc. Although general awareness of artificial intelligence methods is increasing, it is still not common for professionals from non-technical fields to have a detailed understanding of how such systems work and learn. This text aims to explain the basics of machine learning in an accessible way using examples and illustrations from digital pathology. This is not intended to be a comprehensive overview or an introduction to cutting-edge methods. Instead, we use the simplest models to focus on fundamental concepts behind most learning systems. The text concentrates on decision trees, whose functionality is easy to explain, and basic neural networks, the primary models used in today’s artificial intelligence. We also attempt to describe the collaborative process between medical specialists, who provide the data, and computer scientists, who use this data to develop learning systems. This text will help bridge the knowledge gap between medical professionals and computer scientists, contributing to more effective interdisciplinary collaboration.
- MeSH
- lidé MeSH
- patologie * trendy MeSH
- strojové učení * trendy MeSH
- umělá inteligence trendy MeSH
- Check Tag
- lidé MeSH
Tým pracovníků Vysokého učení technického v Brně a Masarykovy univerzity vyvíjí webovou aplikaci, jejímž cílem je poskytovat terapeutům zpětnou vazbu na základě automatického zpracování pravidelně získávaných dotazníkových dat a audionahrávek z terapeutických sezení (z projektové zprávy).
An expert team from Brno University of Technology and Masaryk University is developing a web application to provide therapists with feedback based on automatic processing of regularly collected questionnaire data and audio recordings from therapy sessions (from project report).
In response to our study, the commentary by Infanti et al. (2024) raised critical points regarding (i) the conceptualization and utility of the user-avatar bond in addressing gaming disorder (GD) risk, and (ii) the optimization of supervised machine learning techniques applied to assess GD risk. To advance the scientific dialogue and progress in these areas, the present paper aims to: (i) enhance the clarity and understanding of the concepts of the avatar, the user-avatar bond, and the digital phenotype concerning gaming disorder (GD) within the broader field of behavioral addictions, and (ii) comparatively assess how the user-avatar bond (UAB) may predict GD risk, by both removing data augmentation before the data split and by implementing alternative data imbalance treatment approaches in programming.
- MeSH
- avatar MeSH
- lidé MeSH
- netholismus * MeSH
- řízené strojové učení MeSH
- strojové učení * MeSH
- uživatelské rozhraní počítače MeSH
- videohry MeSH
- Check Tag
- lidé MeSH
- Publikační typ
- časopisecké články MeSH
TransCelerate reports on the results of 2019, 2020, and 2021 member company (MC) surveys on the use of intelligent automation in pharmacovigilance processes. MCs increased the number and extent of implementation of intelligent automation solutions throughout Individual Case Safety Report (ICSR) processing, especially with rule-based automations such as robotic process automation, lookups, and workflows, moving from planning to piloting to implementation over the 3 survey years. Companies remain highly interested in other technologies such as machine learning (ML) and artificial intelligence, which can deliver a human-like interpretation of data and decision making rather than just automating tasks. Intelligent automation solutions are usually used in combination with more than one technology being used simultaneously for the same ICSR process step. Challenges to implementing intelligent automation solutions include finding/having appropriate training data for ML models and the need for harmonized regulatory guidance.
- MeSH
- automatizace MeSH
- farmakovigilance * MeSH
- lidé MeSH
- strojové učení MeSH
- technologie MeSH
- umělá inteligence * MeSH
- Check Tag
- lidé MeSH
- Publikační typ
- časopisecké články MeSH
- práce podpořená grantem MeSH
Supervised machine learning (ML) is used extensively in biology and deserves closer scrutiny. The Data Optimization Model Evaluation (DOME) recommendations aim to enhance the validation and reproducibility of ML research by establishing standards for key aspects such as data handling and processing, optimization, evaluation, and model interpretability. The recommendations help to ensure that key details are reported transparently by providing a structured set of questions. Here, we introduce the DOME registry (URL: registry.dome-ml.org), a database that allows scientists to manage and access comprehensive DOME-related information on published ML studies. The registry uses external resources like ORCID, APICURON, and the Data Stewardship Wizard to streamline the annotation process and ensure comprehensive documentation. By assigning unique identifiers and DOME scores to publications, the registry fosters a standardized evaluation of ML methods. Future plans include continuing to grow the registry through community curation, improving the DOME score definition and encouraging publishers to adopt DOME standards, and promoting transparency and reproducibility of ML in the life sciences.
- MeSH
- databáze faktografické MeSH
- lidé MeSH
- registrace * MeSH
- reprodukovatelnost výsledků MeSH
- řízené strojové učení * MeSH
- Check Tag
- lidé MeSH
- Publikační typ
- časopisecké články MeSH
The Arteriovenous Access Stage (AVAS) classification simplifies information about suitability of vessels for vascular access (VA). It's been previously validated in a clinical study. Here, AVAS performance was tested against multiple ultrasound mapping measurements using machine learning. A prospective multicentre international study (NCT04796558) with patient recruitment from March 2021-July 2024. Demographics, risk factors, vessels parameters, types of predicted and created VA (pVA, cVA) were collected. We modelled pVA and cVA using the Random Forest algorithm. Model performance was estimated and compared using Bayesian generalized linear models. ROC AUC with 95% credible intervals was the performance metric. 1151 patients were included. ROC AUC for pVA prediction by AVAS was 0.79 (0.77;0.82) and by mapping was 0.85 (0.83;0.88). ROC AUC for cVA prediction by AVAS was 0.71 (0.69;0.74) and by mapping was 0.8 (0.78;0.83). Using AVAS with other parameters increased the ROC AUC to 0.87 for pVA (0.84;0.89) and 0.82 (0.79;0.84) for cVA. Using mapping with other parameters increased the ROC AUC to 0.88 for pVA (0.86;0.91) and 0.85 (0.83;0.88) for cVA. Multiple mapping measurements showed higher performance at VA prediction than AVAS. However, AVAS is simpler and quicker, so may be preferable for routine clinical practice.
- MeSH
- arteriovenózní zkrat MeSH
- Bayesova věta MeSH
- lidé středního věku MeSH
- lidé MeSH
- prospektivní studie MeSH
- ROC křivka MeSH
- senioři MeSH
- strojové učení * MeSH
- ultrasonografie * metody MeSH
- Check Tag
- lidé středního věku MeSH
- lidé MeSH
- mužské pohlaví MeSH
- senioři MeSH
- ženské pohlaví MeSH
- Publikační typ
- časopisecké články MeSH
- multicentrická studie MeSH
- práce podpořená grantem MeSH
- srovnávací studie MeSH
The vast majority of approved drugs are metabolized by the five major cytochrome P450 (CYP) isozymes, 1A2, 2C9, 2C19, 2D6 and 3A4. Inhibition of CYP isozymes can cause drug-drug interactions with severe pharmacological and toxicological consequences. Computational methods for the fast and reliable prediction of the inhibition of CYP isozymes by small molecules are therefore of high interest and relevance to pharmaceutical companies and a host of other industries, including the cosmetics and agrochemical industries. Today, a large number of machine learning models for predicting the inhibition of the major CYP isozymes by small molecules are available. With this work we aim to go beyond the coverage of existing models, by combining data from several major public and proprietary sources. More specifically, we used up to 18815 compounds with measured bioactivities to train random forest classification models for the individual CYP isozymes. A major advantage of the new data collection over existing ones is the better representation of the minority class, the CYP inhibitors. With the new data collection we achieved inhibitor-to-non-inhibitor ratios in the order of 1:1 (CYP1A2) to 1:3 (CYP2D6). We show that our models reach competitive performance on external data, with Matthews correlation coefficients (MCCs) ranging from 0.62 (CYP2C19) to 0.70 (CYP2D6), and areas under the receiver operating characteristic curve (AUCs) between 0.89 (CYP2C19) and 0.92 (CYPs 2D6 and 3A4). Importantly, the models show a high level of robustness, reflected in a good predictivity also for compounds that are structurally dissimilar to the compounds represented in the training data. The best models presented in this work are freely accessible for academic research via a web service.
- MeSH
- inhibitory cytochromu P450 chemická syntéza chemie farmakologie MeSH
- lidé MeSH
- molekulární modely MeSH
- molekulární struktura MeSH
- strojové učení * MeSH
- systém (enzymů) cytochromů P-450 metabolismus MeSH
- vztah mezi dávkou a účinkem léčiva MeSH
- vztahy mezi strukturou a aktivitou MeSH
- Check Tag
- lidé MeSH
- Publikační typ
- časopisecké články MeSH
- práce podpořená grantem MeSH